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Vorwort 


Was taugen Verfahren der Vergangenheit, um die Ökonomie der Zukunft zu ver- 
messen? Der Urmeter der Ökonomie, das Bruttoinlandsprodukt (BIP), dürfte für 
kommende Zeiten kaum mehr das Maß aller Dinge sein. Zu stark sind die durch 
technologische Fortschritte verursachten grundsätzlichen Mängel des BIP-Kon- 
zepts. Nicht erst seitdem das Coronavirus viele alte Gesetzmäßigkeiten in Frage 
stellt, bestehen Zweifel, inwieweit Messverfahren aus der Hochzeit der Indust- 
rialisierung dem strukturellen Wandel zunächst zu einer Dienstleistungsgesell- 
schaft, später zu einer Digitalwirtschaft und nun zu einer Datenökonomie ge- 
recht werden (können). Vielmehr drängte sich bereits vorher an mancher Stelle 
eine Neuorientierung auf. 

Die nachfolgenden Überlegungen und Erkenntnisse wollen zu einer er- 
folgreichen Suche nach neuen Verfahren der Messung ökonomischer Aktivi- 
täten beitragen. Dabei geht es im ersten Teil um Messprobleme und darum, 
inwieweit sie bei der Diagnose und Prognose wirtschaftlicher Entwicklungen 
zu analytischen Fehlern führen. Der zweite Teil vermittelt einen Überblick über 
neue empirische Ansätze, mit deren Hilfe besser erfasst werden kann, was sich 
in der (Daten-)Okonomie abspielt. 

Präsentiert werden Einsichten und Ergebnisse des Forschungsprojekts 
„Neuvermessung der Weltwirtschaft“, das von der NORDAKADEMIE-Stiftung 
(Elmshorn/Hamburg) finanziell gefördert wurde. Für diese großzügige Unter- 
stützung sei allen Verantwortlichen herzlich gedankt. 

Ebenso ist der Universität Hamburg zu danken, die dem Forschungspro- 
jekt Gastrecht gewährte und die füreinen Großteil der Autorinnen und Autoren 
eine stimulierende und kreative Arbeitsatmosphare schuf. 


Hamburg, im Sommer 2021 
Thomas Straubhaar 
Projektleiter und Herausgeber 


Einleitung 


Datenwirtschaft: Was ist neu und anders? 


Thomas Straubhaar 


„Ihe world’s most valuable resource is no longer oil, but data.“ So eindeutig fällt 
das Urteil der britischen Wochenzeitschrift The Economist aus.! Wie richtig die 
These ist, lässt sich mit einer Rangliste der weltweit wertvollsten Firmen ver- 
anschaulichen. Mitte 2021 steht Apple mit einem Börsenwert (BW) von rund 2,0 
Billionen Euro an der Spitze.? Insgesamt sieben der zehn höchstbewerteten Un- 
ternehmen haben mit (digitaler Infrastruktur und Plattformen) der Datenöko- 
nomie zu tun. Neben Apple sind das Microsoft (BW 1,8 Bio. Euro), Amazon (BW 
1,6 Bio. Euro), die Google-Mutter Alphabet (BW 1,3 Bio. Euro) und Facebook (BW 
0,7 Bio. Euro) sowie die chinesischen (Daten-)Handelsplattformen Tencent und 
Alibaba.? 

Daten sind der Rohstoff der Digitalisierung. Sie sind, was Öl und Gas für 
das Industriezeitalter waren. Sie treiben in nahezu allen ökonomischen Berei- 
chen weitreichende Verhaltensänderungen an - auch im Alltag. Sie verändern 
Informationswege und Kommunikationskanäle. Sie ermöglichen neue Formen 
von Wertschöpfung und Arbeit, Produktion und Konsum. Kein Lebensbereich, 
der nicht durch die Datenwirtschaft radikal betroffen wäre. Das gilt auch für 
ökonomische Theorie und Empirie. 


1 Economist (2017). 
2 Finanzen100 (2021). 


?  Finanzen100 (2021). Allerdings steht mit Saudi Aramco ein Unternehmen der traditionellen Roh- 
stoffökonomie auf Platz zwei der Rangliste. Die Erdölfördergesellschaft aus Saudi-Arabien war im 
Dezember 2019 mit dem größten Börsengang in der Weltgeschichte sofort mit Platz eins ins Ranking 
eingestiegen (siehe dazu: Tagesschau 2021). Im Laufe von 2020 fiel jedoch der Börsenwert von Saudi 
Aramco auf 1,5 Bio. Euro. 
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Die Coronapandemie war ein Augenoffner, was Digitalisierung und Daten- 
wirtschaft in der Praxis bedeuten. Der Bevölkerung wurde nahezu über Nacht 
flächendeckend vorgeführt, wie sehr digitale Technologien bisherige Gewohn- 
heiten umzukrempeln vermögen. Onlinebestellungen machten das Einkaufen 
in Supermärkten überflüssig. In Schulen und Universitäten trat Fernunterricht 
an die Stelle von Präsenzlehre. Homeoffice führte zu leeren Geschäftsbüros. Vi- 
deobesprechungen erübrigten Fernreisen. An vielen Stellen ersetzte ein Daten- 
transfer den Warenhandel. Der ökonomische Strukturwandel von einer Güter- 
zu einer Dienstleistungs- und weiter zu einer Digitalisierungswirtschaft wurde 
im Laufe der Coronapandemie und ihrer Bekämpfung noch einmal beschleu- 
nigt. 

Die gravierenden Unterschiede zwischen Güter- und Datenökonomie er- 
fordern neue Konzepte, um das Wesen von Big Data zu erfassen, zu vergleichen 
und zu verstehen. Eine neue Datenökonomik für eine neue Datenökonomie ist 
das eine.* Eine Neuvermessung der Wirtschaft ist das andere. Beides zusam- 
men wird notwendig, wenn neben einer sichtbaren Waren- eine unsichtbare 
Datenwirtschaft wichtig(er) wird. Oder wie es Liran Einav und Jonathan Levin 
von der Stanford University ausdrücken: „More granular and comprehensive 
data surely allow improved measurements of economic effects and outcomes, 
better answers to old questions, and help in posing new questions and enab- 
ling novel research designs. We also believe that new data may change the way 
economists approach empirical research, as well as the statisticaltools they em- 


ploy.”® 


Grundlagen einer Datenökonomie 


Die Datenökonomie unterscheidet sich fundamental von der Güterwirtschaft.? 
Denn anders als Güter sind Daten nicht dinglicher Natur. Sie sind unsichtbar. 
Sie wabern virtuell losgelöst von Standorten, In- und Ausland, durch Internet 
und Orbit. Big Data ist „huge in volume, ... high in velocity, ... diverse in variety, 


* Stellvertretend für andere Einav/Levin (2014). 
° Stellvertretend für andere Harding/Hersh (2018). 
6 Einav/Levin (2014). 


7 Stellvertretend für andere Wambach/Müller (2018), IMF (2019) und Azkan et al. (2020) aus volks- 
wirtschaftlicher sowie Ochs et al. (2019) aus sozioökonomischer Sicht. 
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.. exhaustive in scope, ... fine-grained in resolution, ... relational in nature, ... fle- 
xible in scalabilty“.® 

Loslösung ist das Wesen der Datenwirtschaft. Ökonomische Aktivitäten 
entbinden und entgrenzen sich gleichzeitig von Dingen, Fabriken, Standorten 
oder Wirtschaftsräumen. Sie werden „entdinglicht“, wenn Daten anstelle von 
Gütern produziert, gehandelt und verkauft werden - also beispielsweise Mu- 
sik nicht mehr auf Schallplatten, sondern über Spotify angeboten wird. Sie 
werden „entterritorialisiert“, wenn mehr und mehr Glieder der Wertschöpfung 
in virtuelle Wolken („Clouds“) des Orbits verlagert werden und beispielsweise 
Professorinnen und Professoren nicht mehr in Hörsälen unterrichten, sondern 
Studierende die Angebote virtueller Online-Universitäten nutzen. Und sie wer- 
den „entstaatlicht“, weil das Internet keine physischen Grenzen und damit auch 
keine Landesgrenzen, Volkswirtschaften oder Nationalökonomien mehr kennt. 

Daten machen die Welt zum Dorf. Raum und Territorialität verlieren an 
Bedeutung. In der Datenwirtschaft ist eine geografische Festlegung von Her- 
kunft, Verarbeitung, Vermarktung und Nutzung schwierig bis kaum möglich. 
Information und Kommunikation machen an nationalen Grenzen nicht halt. 
Alles und jedes ist in Echtzeit überall bekannt und verfügbar. Staatsgrenzen 
verschwimmen und Unternehmensgrenzen verschwinden. 

Daten zu transferieren und auszutauschen kostet nahezu nichts. Sie sind 
um Dimensionen rascher hin und her zu bewegen als Güter, aber auch als 
Dienstleistungen, bei denen oft die Präsenz der anbietenden und/oder nachfra- 
genden Person erforderlich ist — beispielsweise bei medizinischen Operationen. 
Digitalisierung und Datenökonomie ermöglichen entpersonalisierte Dienstleis- 
tungen. Beispielsweise erlaubt die Telemedizin, klinische Eingriffe auf Distanz 
durchzuführen — Patient und Ärztin müssen sich nicht vor Ort treffen. Binäre 
Daten (insbesondere in Text-, Wort- oder Bildformaten) ersetzen Warenhandel 
oder persönliche Kontakte. 

Die Datenökonomie ist eine Ökonomie der Transparenz. „Gläsern“ zu wer- 
den schafft nicht nur Nachteile. Es sorgt auch dafür, dass Informationen überall 
und jederzeit für alle gleichermaßen zur freien Nutzung bereitstehen. Noch nie 
in der Menschheitsgeschichte war es auch nur annähernd so einfach und um- 
fassend möglich, so viel Information und Wissen so schnell und so billig welt- 
weit und in Echtzeit auszutauschen wie heute. Das hat die Lebensqualität na- 
hezu überall enorm verbessert. Angebote und Preise, Löhne und Zinsen lassen 


® Saetnan et al. (2018), S. 3. 
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sich transparent vergleichen, was Wettbewerb fordert und Verbraucherrechte 
verbessert. Genauso konnten Herrschaftswissen, Informationsmonopole und 
Wissensdefizite beseitigt und damit demokratische Bewegungen und die Rech- 
te von Minderheiten gestarkt werden. 

Datenökonomie wird eine neue Dezentralitat ermöglichen, die mit der In- 
dustrialisierung in weiten Teilen verloren gegangen war. In der Guterwirtschaft 
erzwangen die immensen Fixkosten der industriellen Produktion die Zentrali- 
sierung der Produktion in riesigen Fabriken, in denen Massen von Beschaftigten 
aktiv tätig waren. Von (angestrebt nur) einem Standort aus wurden dann mög- 
lichst hohe Stückzahlen hergestellt. So ließen sich Durchschnittskosten senken. 

Mit der Zentralisierung ging eine Spezialisierung einher. Die Glieder der 
industriellen Wertschöpfungskette wurden in immer kleinere Teile zerlegt. So 
lohnte es sich für jedes einzelne Glied, spezielle Facharbeiter auszubilden und 
ebenso spezielle maschinelle Fabrikationshilfen anzuschaffen. Je größer die 
Stückzahlen waren, umso stärker konnten die Spezialisierungsvorteile ausge- 
nutzt und umso breiter die Spezialisierungsinvestitionen (für Anschaffung von 
Wissen und Maschinen) umgelegt werden. In Folge dessen sanken die durch- 
schnittlichen Kosten pro Stück weiter. 

In der Post-Corona-Datenwirtschaft wird „hybrid“ zum Zauberwort wer- 
den. Es bezeichnet die intelligente Mischung zwischen Vereinheitlichung (um 
die Vorteile der Standardisierung, also der „Economies of Scale“ zu nutzen) und 
Vielfalt (um individuell unterschiedlichen Ansprüchen gerecht zu werden). Mit 
hybriden Strukturen wird eine kluge Aufteilung von Zentralität und Dezentra- 
lität bei Produktion und Konsum einhergehen. Vieles wird an einer Stelle ein- 
heitlich programmiert, vorgegeben, organisiert und umgesetzt. Manches jedoch 
wird vor Ort, zu Hause oder beim Kunden geleistet, hergestellt oder ausgedruckt. 

Über allem und jedem, was in einer „hybriden“ Wirtschaft und Gesell- 
schaft passiert und geschieht, wird das Damoklesschwert von Optimierung und 
Verbesserung schweben. Es wird nahezu automatisch und ansonsten mit An- 
reizen — vielleicht auch Sanktionen — dafür sorgen, dass in der Datenwirtschaft 
des Post-Corona-Zeitalters mehr als jemals zuvor Effizienz und Effektivität zum 
Maß aller Dinge werden. Das hilft, ökonomischen Leerlauf zu verringern und 
ökologische Verschwendung zu vermeiden. 

In der Datenwirtschaft wird künstliche Intelligenz neben menschliches 
Wissen treten und den Alltag mehr und mehr erleichtern und verbessern. So- 
bald Menschen digital miteinander kommunizieren und arbeiten, online ein- 
kaufen und tauschen, betreten sie das Spielfeld, auf dem Algorithmen und 
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selbstlernende Systeme das Sagen haben und die Regeln bestimmen. Dort wird 
alles und jedes stets und immerzu gemessen, bewertet und verglichen. Was ak- 
tuell das Beste ist, wird zum Mafstab fiir alles andere. Fehler und Abweichun- 
gen werden sofort erkannt und sogleich behoben. 

Optimierung, Standardisierung und Skalierung bilden die entscheidungs- 
und handlungsleitende Trilogie der Datenökonomie. Was sich irgendwo be- 
währt (hat), wird in gleicher oder ähnlicher Weise überall kopiert. Zunächst 
einzelne, im Laufe der Zeit jedoch immer mehr Glieder der Wertschöpfung und 
später auch Bereiche des gesellschaftlichen Miteinanders werden sich dem ste- 
ten Qualitätstest zu stellen haben. Was passt, überlebt, alles andere geht unter. 


Grundlagen einer Datenökonomik 


Die Datenwirtschaft verlangt ein radikales Umdenken in nahezu allen Dimen- 
sionen ökonomischen Denkens, das sich stark an physischen Gütern orientiert, 
mit abnehmendem Grenznutzen beim Konsum und steigenden Grenzkosten 
bei der Herstellung. 

Bei Daten gibt es — wiederum anders als bei Gütern — keine Abnutzung. 
Zwischen verschiedenen Nutzungszwecken von Daten besteht kein Konflikt. 
„Nur, weil jemand bestimmte Daten nutzt, schließt dies - anders als eben beim 
Öl- nicht die parallele oder sequenzielle Nutzung derselben Daten durch ande- 
re aus.“? Während viele Personen die gleichen Daten gleichzeitig auf verschie- 
dene Art und Weise nutzen, wird die Qualität der aus den Daten gewonnenen 
Informationen und Einsichten nicht schlechter, sondern vielleicht sogar besser. 
Gerade die Weiterverwendung, die Verknüpfung und Mehrfachnutzung von 
Daten erzeugt positive Netzwerkeffekte und macht deren Gebrauch für alle Be- 
teiligten eher noch wertvoller. Wer Daten teilt, hat (oft) nicht weniger, sondern 
mehr davon. Aus der gemeinsamen Datennutzung kann ein Mehrwert für alle 
entstehen — etwa, wenn aus einer Vielzahl unterschiedlicher Blogeinträge ein 
Allgemeinwissen darüber entsteht, wie Alltagsprobleme — beispielsweise die 
Entfernung von Kleiderflecken — einfach behoben werden können. 

Daten sind also eher ein öffentliches als ein privates Gut. Wenn die Fix- 
kosten für Netzinfrastruktur, Hard- und Software einmal entstanden sind, kön- 
nen Daten mit sehr geringen Grenzkosten, also nahezu ohne Zusatzkosten, von 


> Haucap (2018), S. 472. 
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vielen anderen verarbeitet, verbreitet und weiterverwendet werden. Ein Aus- 
schluss von Nutzern durch Bezahlschranken hat wenig mit technischen Kapa- 
zitätsgrenzen, Abnutzungseffekten oder gegenseitiger Beeinträchtigung zutun. 
Er erfolgt aus kommerziellen Gründen, um die Hersteller für ihren Aufwand zu 
entschädigen. Aber nur für einen Bruchteil der Datentransfers kommen (bis an- 
hin) Bezahlsysteme zur Anwendung. Die meisten Daten jedoch sind mehr oder 
weniger frei verfügbar, so wie Allgemeinwissen auch allen ohne direkte Gegen- 
leistung zugänglich ist. 

Die Datenökonomie trägt den Keim einer Monopolisierung in sich. Big-Da- 
ta-Konzerne können eine Marktmacht erlangen, die es ihnen ermöglicht, „Big 
Profits“ zulasten der Verbraucherinnen und Verbraucher zu erzielen. Ursache 
hierfür sind die immensen Fixkosten der Datenverarbeitung auf der einen und 
die nahezu vollständige Abwesenheit variabler Kosten der Datennutzung auf 
der anderen Seite. Derartige Skaleneffekte sind der Humus, auf dem Monopole 
bluhen.1° 

Hinzu kommen Pioniervorteile und Pfadabhangigkeiten, wie sie fur di- 
gitale Plattformen charakteristisch sind. Erstere entstehen, weil Regeln und 
Standards derjenige setzen kann, wer zuerst kommt. Letztere spielen eine Rolle, 
weil sich Nutzer an gewisse Marken und Produkte, bestimmte Verfahren, Ab- 
laufe oder Verhaltensweisen so sehr gewohnt haben, dass Kundentreue und Ge- 
wohnheiten dazu führen, immer wieder bekannte Produkte zu kaufen und zu 
nutzen. Plattformen haben so viele Daten und Informationen über ihre Nutzer, 
dass sie mit Hilfe von Algorithmen präzise Kundenprofile erstellen und damit 
den gläsernen Nutzer schaffen können. 

Pioniere haben einen Startvorsprung. Sie sind oft in einer Monopolstel- 
lung. So sind sie in der Lage, zu Beginn neuer Produktzyklen jene Gewinne zu 
erwirtschaften, die später notwendig sind, um sich die im Laufe der Zeit als 
Nachahmer auf den Markt drängende Konkurrenz vom Halse zu halten. Dank 
einer dominanten Marktposition, bestehender Kundenbeziehungen und früher 
erzielter Gewinnpolster können sich einmal etablierte Big-Data-Firmen jeder- 
zeit auf einen Preiswettbewerb einlassen, der für sie zwar schmerzlich, für Kon- 
kurrenten jedoch ruinös ist. 

Laufende Profite wiederum sind die eigene Kapitalquelle (oder die für au- 
ßenstehende Eigenkapitalgeber entscheidende Attraktion, neues Wagniskapi- 
tal einzuschießen), aus der die Big-Tech-Firmen die gewaltigen Investitionen in 


10 Einschränkend dazu Dewenter/Lüth (2016). 
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stetige Innovationen finanzieren konnen, die mit dem Aufbau einer sich ver- 
stetigenden Monopolposition einhergehen. Damit aber ist vorgezeichnet, dass 
„Big Data“ mit „Big Profits“ einhergehen kann, was erklärt, wieso die großen 
Datenkonzerne die Weltrangliste des Big Business (gemessen am Wert der Bör- 
senkapitalisierung) anführen. 


Warum eine Neuvermessung der Wirtschaft erforderlich wird 


Was sich in der Ökonomie an dynamischem Wandel abspielt, verlangt nach ei- 
ner Neuvermessung der wirtschaftlichen Aktivitäten, insbesondere der Wert- 
schöpfung und der Produktivität. Denn die Ökonomik findet ihre (statistischen) 
Grundlagen in der Agrarwirtschaft und deren Weiterentwicklung im Zeitalter 
der Industrialisierung. " Sie hat sich bereits mit Dienstleistungswirtschaft und 
Wissensgesellschaft schwergetan. Beide entzogen sich gängigen Verfahren der 
Messung, des Zählens und Bewertens, wie sie in der Güterwirtschaft mit ihren 
haptischen, physisch fassbaren Produkten charakteristisch sind. Gleiches und 
noch viel mehr anderes gilt in besonderem Maße für die Datenwirtschaft mit 
ihren nicht greifbaren, in virtuellen Räumen fließenden Bits und Bytes.!? 
Herkömmliche (makro-)6konomische Messverfahren wie das BIP sind völ- 
lig ungeeignet, das Wesen der Datenökonomie und den Charakter der Daten ab- 
zubilden. Das BIP ist ein „statistisches Konstrukt“ und kein „hartes Faktum“.B Es 
ist eher ein errechnetes als ein gemessenes Maß. Es misst Quantitäten, die sich 


" Die lange Entstehungsgeschichte des (makro-)ökonomischen Vermessungswesens begann im 
17. Jahrhundert mit William Pettys ersten Schätzungen für des Volkseinkommens in England. Der 
Hofarzt Ludwigs XV., Francois Quesnay, im 18. Jahrhundert, Karl Marx im 19. Jahrhundert sowie Leon 
Walras und Alfred Marshall im Übergang zum 20. Jahrhundert führten sie weiter. Die „Volkswirt- 
schaftlichen Gesamtrechnungen“ erhielten mit der Entwicklung eines BIP-Konzepts in der Zwi- 
schenkriegszeit einen Schub. Die damals gewaltigen makroökonomischen Verwerfungen machten 
eine bessere Vermessung ökonomischer Aktivitäten erforderlich. Aus kontroversen Ideen von John 
Maynard Keynes, Richard Stone, James Meade, Simon Kuznets und Wassily Leontief entstand in den 
1950er-Jahren ein international standardisiertes Verfahren, mit dessen Hilfe das BIP weltweit nach 
einheitlichen Methoden gemessen wurde. Vgl. dazu Stobbe (1988) sowie als Ubersicht OECD (2014). 


12 Vgl. dazu exempalrisch Varian (2014) oder Garboden (2020). 


"Die Unterscheidung zwischen „harten Fakten“, die sich „objektiv“ durch „zählen“, „messen“ oder 
„wiegen“ erfassen lassen, und „statistischen Konstrukten“, die eher „subjektiv“ durch „bewerten“ 
und „beobachten“ errechnet werden, geht auf den Wirtschaftsnobelpreisträger Richard Stone (2013) 
zurück, der zwischen „primary facts“ und „empirical constructs“ unterscheidet. „Primary Facts“ ent- 
sprechen der direkt messbaren „Quantität“, während „statistical constructs“ eher die „Qualität“ 
widerspiegeln, die sich indirekt aus der subjektiven Bewertung ergibt. 
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mehr oder weniger exakt und „objektiv“ erfassen lassen. Deren Qualität ergibt 
sich aus der subjektiven Wertschätzung von Herstellern und Kunden und aus 
Angebot und Nachfrage durch Kosten und Preise. In die BIP-Messung fließen 
dann die Umsätze (also faktisch das Produkt aus Mengen und Preisen) ein, von 
denen lediglich die Vorleistungen subtrahiert werden, um die Bruttowertschöp- 
fung zu erhalten.” 

Stärken und Schwächen des BIP-Konzepts sind hinlänglich bekannt.?? Vie- 
le fundamentale konzeptionelle Mess-, Erfassungs- und Bewertungsprobleme 
haben immer schon zu harscher Kritik an einem BIP-Fetischismus der Ökono- 
mik geführt.!6 Entsprechend der begrenzten Aussagekraft des BIP-Konzepts gab 
und gibt es seit je eine Vielzahl von Ansätzen zur Verbesserung.” Die größte in- 
ternationale Beachtung erlangte der seit 1990 veröffentlichte Human Develop- 
ment Index (HDI) der Vereinten Nationen.!® Der HDI ergänzt und verknüpft das 
BIP mit der Lebenserwartung bei der Geburt und der Dauer der Schulbildung 
und will so den sozioökonomischen Entwicklungsstand innerhalb von Ländern 
messen und vergleichen. 


14 Alle Varianten der Erfassung — beispielsweise über Kosten (wie Löhne und Zinsen) - sind nur 
„künstlich“ vorgenommene indirekte Berechnungen (und eben keine direkten Messungen), die aus 
den ursprünglichen Umsätzen durch Umformungen und Plausibilitätsrechnungen abgeleitet bezie- 
hungsweise geschätzt werden. 


13 Angesichts der Fülle von Publikationen, die sich mit den Vor- und Nachteilen, Stärken und Schwä- 
chen sowie grundsätzlichen Mängeln beschäftigen, sei hier nur auf Stobbe (1994), den „Klassiker“ 
der deutschsprachigen Literatur, und auf eine Zusammenfassung von Hubl (2007) hingewiesen. Rath 
und Braakmann (2014) präsentieren einen umfassenden, kompetenten Überblick zur Generalrevision 
der Volkswirtschaftlichen Gesamtrechnungen 2014 für den Zeitraum 1991 bis 2014. 


16 Die jüngere Kritik begann mit den Publikationen des Club of Rome (Meadows et al. 1972) und ist 
unverändert im Gange bei den heutigen Degrowth-Diskussionen (Schmelzer 2016, Konzeptwerk 
Neue Ökonomie 2017). 


Dazu gehört beispielsweise, dass nach Vorgaben der Europäischen Kommission in den BIP-Be- 
rechnungen nun auch illegale Transaktionen wie Drogenhandel, Alkohol- und Tabakschmuggel oder 
Bestechungsgelder erfasst werden (Taschowsky 2015). Anders als in anderen EU-Ländern war in 
Deutschland die „Bruttowertschöpfung“ der Prostitution schon vorher im BIP miteinbezogen - und 
vom Statistischen Bundesamt für das Jahr 2013 auf 7,3 Mrd. Euro geschätzt worden, was knapp einem 
drittel Prozent des deutschen BIP entspricht (Plickert 2014). Schneider und Boockmann (2020), S. 22 
schätzen, dass die Wertschöpfung in der sogenannten Schattenwirtschaft (definiert als ökonomische 
Aktivitäten, aus denen Einkommen erzielt, aber staatliche Regulierung, Besteuerung oder Erfassung 
vermieden wird) im Jahr 2020 für Deutschland 322 Mrd. Euro erreicht, was etwa 9 % des offiziell 
ausgewiesenen BIP entspricht. Allerdings beinhaltet diese Schätzung zu einem kleinen Teil auch 
bereits Aktivitäten, die im offiziellen BIP erfasst werden (wie beispielsweise den Drogenhandel). 
„Rechnet man diese heraus, liegt die Wertschöpfung (der Schattenwirtschaft T. S.) bei schatzungs- 
weise 210 Mrd. Euro“ oder rund 6 % des offiziellen BIP (Enste 2019), S. 153. 
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Eine Reihe anderer monetärer Wohlfahrtsindikatoren (die das BIP um zu- 
sätzliche soziale und ökologische Parameter ergänzen) wie der Index of Sustain- 
able Economic Welfare (ISEW) und der daraus entstandene Genuine Progress 
Indicator (GPI) oder der Nationale Wohlfahrtsindex (NWI) genauso wie Mehr- 
komponentenindikatoren wie der Index of Economic Well-Being (IEW-B) und 
der Index of Social Health (ISH) wurden als Alternativen zum BIP entwickelt.!° 

In Deutschland suchte die Enquete-Kommission „Wachstum, Wohlstand, 
Lebensqualität — Wege zu nachhaltigem Wirtschaften und gesellschaftlichem 
Fortschritt in der Sozialen Marktwirtschaft“ nach Messkonzepten jenseits des 
BIP2° Ziel der vom Deutschen Bundestag eingesetzten insgesamt 62 Mitglieder, 
die mehr als zwei Jahre lang als parlamentarische Expertinnen und Experten 
und externe Sachverständige in der Enquete-Kommission mitgewirkt haben, 
war es, „in Ergänzung zum BIP“ einen „ganzheitlichen Wohlstands- beziehungs- 
weise Fortschrittsindikator“ zu schaffen. Der neue Urmeter der Ökonomie solle 
insbesondere „den materiellen Lebensstandard, Zugang zu und Qualität von Ar- 
beit, die gesellschaftliche Verteilung von Wohlstand, die soziale Inklusion und 
Kohäsion, intakte Umwelt und Verfügbarkeit begrenzter natürlicher Ressour- 
cen, Bildungschancen und Bildungsniveaus, Gesundheit und Lebenserwartung, 
Qualität öffentlicher Daseinsvorsorge, sozialer Sicherung und politischer Teil- 
habe sowie die subjektiv von den Menschen erfahrene Lebensqualität und die 
Zufriedenheit“ beachten.?! 

Als Ergebnis ihres 844-seitigen Schlussberichts veröffentlichte die Enque- 
te-Kommission im Mai 2013 ein „erweitertes BIP“, das neben dem Materiellen 
auch die Wohlstandsdimensionen Soziales/Teilhabe und Ökologie abbildet. „Die 
aus zehn zentralen Variablen bestehenden W? Indikatoren sollen künftig darü- 
ber Auskunft geben, wie es in Deutschland um Wohlstand und Lebensqualität 
steht.“2? Fakt ist, dass mit der Vorlage des Schlussberichts auch gleich das Ende 
eines Neuanfangs besiegelt wurde. Denn seit 2013 wurden das „erweiterte BIP“ 
und die zehn Leitindikatoren weder faktisch in den statistischen Alltag umge- 
setzt noch in der wirtschaftspolitischen Arena weiterverfolgt. 


12 Die Enquete-Kommission (2013) liefert in ihrem Kapitel 6 (S. 302-327) eine ausführliche Stär- 
ken-Schwächen-Analyse zu zahlreichen anerkannten und aussagekräftigen Wohlstandsmaßen und 
in Kapitel 7 (S. 327-331) empirische Erfahrungen mit deren konkreter Anwendung in vier Ländern 
(Australien, Kanada, Großbritannien und USA). 


2° Enquete-Kommission (2013). 
2! Enquete-Kommission (2013), S. 231. 
22 Enquete-Kommission (2013), S. 28. 
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So bleiben die enormen Anstrengungen der statistischen Ämter zu wür- 
digen, Teilaspekte der Volkswirtschaftlichen Gesamtrechnungen (VGR) wei- 
terzuentwickeln und zum Beispiel Aspekte der Einkommens- und Vermö- 
gensverteilung, Nettogrößen, Haushaltsperspektive und andere neue Themen 
einzubeziehen. „Allerdings besteht hier die Gefahr einer Überfrachtung der VGR 
und die Ableitung statistischer Artefakte. Das gegenwärtige System der VGR 
weist bereits eine hohe Komplexität auf. ... Auch für die Volkswirtschaftlichen 
Gesamtrechnungen gibt es eine Grenze der Universalität.“?? Diese Feststellung 
dürfte in Zeiten starker technologischer Umwälzungen und der daraus folgen- 
den enormen Dynamik von Veränderungen in allen Bereichen von Wirtschaft, 
Gesellschaft und Politik ganz besonders zutreffen. 

Wenn ökonomische Aktivitäten losgelöst von physischen Gütern, Erdbo- 
den und Nationalstaaten in der Datenwirtschaft virtueller Netzwelten erfolgen, 
hat das gewaltige Rückwirkungen auf die Ökonomie (die Wirtschaft als Objekt, 
das analysiert wird) und die Ökonomik (die Wirtschaftswissenschaft als Sub- 
jekt, das analysiert). Löst sich die Wirtschaft von Räumen, Personen, Firmen und 
Volkswirtschaften, lässt sich (digitale) Wertschöpfung nicht mehr verlässlich 
fixen Quellen oder einzelnen Volkswirtschaften zuordnen. Wenn im Orbit un- 
sichtbare Daten anstelle dinglicher Produkte gehandelt werden, dann wirken 
makroökonomische Analysen altbacken und überholt, die Menschen, Unter- 
nehmen, Sektoren, Regionen oder gar Staaten in Gruppen zusammenfassen 
und als homogene Untersuchungsgegenstände handhaben. 

Die Wertschöpfung im Internet, der virtuelle Handel mit digitalen Daten 
sowie die Effekte einer Sharing Economy, in der gerade „teure“ langlebige Güter 
— wie Wohnungen, Autos oder Elektrogeräte — gemeinsam genutzt und nicht 
einzeln erworben werden, entziehen sich in beachtlichen Teilen der sachlichen 
Erfassung, räumlichen Zuordnung und zeitlichen Abgrenzung. Deshalb sind das 
BIP und seine Messverfahren von geringerer Aussagekraft denn je. 

Das Ende der Volkswirtschaft als homogen abgrenzbarer Untersuchungs- 
gegenstand und die am Anfang stehende Entwicklung hin zu digitalen Hand- 
lungsebenen verlangt neue Perspektiven der Ökonomik auf das, was sich in der 
Ökonomie abspielt. Alte Strukturen werden in Frage gestellt, die das wirtschafts- 
wissenschaftliche Denken, die statistische Vermessung der Wirtschaft und das 
wirtschaftspolitische Handeln in den letzten Jahrhunderten bestimmt haben. 


23 Räth (2016), S. 113. 
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»GDP is a statistic designed for mass production. ... It falls short in measu- 
ring intangible benefits.“24 Und noch weniger wird das BIP in der Lage sein, die 
digitale Ökonomie abzubilden. Entsprechend größer wird die Kluft zwischen 
BIP-Messung und Realität. Und umso größer ist die Gefahr, wirtschaftspoliti- 
sche Fehlschlüsse zu ziehen. 

Statistische Ämter haben in der Vergangenheit (durchaus erfolgreich) eine 
Vielzahl von Schätzverfahren, Behelfsrechnungen und Korrekturmaßnahmen 
angewandt, um die Aussagekraft und Belastbarkeit des BIP auch in Zeiten dy- 
namischer Innovationen zu sichern. Aber bereits den Strukturwandel von der 
„dinglichen“ Industrie- zur „unsichtbaren“ Dienstleistungs- und Wissensge- 
sellschaft konnte das BIP-Konzept nur noch begrenzt abbilden. „Für spezielle 
Analysen neuerer Phänomene wie Digitalisierung, Globalisierung oder ‚Sharing 
Economy’ sind jedoch ergänzende Messansätze erforderlich.“?5 

Eine neue Datenökonomik soll helfen, besser zu verstehen, was sich im 
Zeitalter der Daten, der Algorithmen, der künstlichen Intelligenz, der selbstler- 
nenden Automaten und der Automobilität selbstständiger Fahrzeuge alles än- 
dert und welche Chancen und Risiken sich daraus ableiten lassen. Einen kleinen 
Beitrag zum besseren Verständnis einer großen Wissenslücke zu liefern, ist Ziel 
der in diesem Buch vereinten Beiträge, die sich in zwei Themenfelder teilen. 


Inhaltsüberblick 


Im ersten Teil geht es um eine alte Angst, die neues Interesse findet. Wie bereits 
vor hundert Jahren beschäftigt besorgte Zeitgenossen das Paradox, dass große 
technologische Innovationen die Welt nicht voranbringen, sondern zurück- 
werfen. Damals sagten führende Intellektuelle der Weltwirtschaft eine „säku- 
lare Stagnation“ voraus, obwohl immense Fortschritte im Gesundheitswesen, 
bei Verkehr und Transport, Kommunikation, Logistik und Mobilität erkennbar 


24 Coyle (2014), 5.125. 


25 Statistisches Bundesamt (2017), S. 36. Der in Theorie und erster Anwendung wohl am weitesten 
entwickelte Ansatz ist das GDP-B-Konzept von Brynjolfsson et al. (2019). Das GDP-B geht über das BIP 
hinaus („beyond GDP“), weil es von der Nutzenseite her versucht, den Wert (Benefits) frei verfügbarer 
Daten der Digitalwirtschaft zu messen. Beispielsweise versuchen die Autoren zu schätzen, welchen 
monetären Betrag Nutzerinnen und Nutzer für Facebook zu zahlen bereit wären. Aus ähnlichen Expe- 
rimenten wird dann ein gesamtwirtschaftlicher Mehrwert ermittelt, der sich aus Digitalwirtschaft 
und Datenökonmie ergibt und um den das BIP zu vergrößern wäre. Allein Facebook würde demgemäß 
das US-BIP um 0,05 bis 0,11% pro Jahr höher ausfallen lassen, als es tatsächlich ausgewiesen wird. 


20 Thomas Straubhaar 


wurden. Der Menschheit stehe eine lange Phase ökonomischen Nullwachstums 
bevor. 

Ahnliche Prognosen eines verlangsamten wirtschaftlichen Fortschritts 
finden sich heutzutage erneut. Vielfach wird das Urteil geteilt, dass trotz oder 
gerade wegen der Digitalisierung und ihrer Folgen die Zeiten schlechter und 
nicht besser wurden. Einen Beleg fiir die negativen Zukunftsaussichten liefern 
scheinbar die Produktivitatsfortschritte. Sie haben sich in den USA und Europa 
in den letzten Dekaden stetig verlangsamt. 

An dieser Stelle setzt der Beitrag Henning Vöpels ein. Vöpel beschreibt, 
wie sich die makroökonomische Produktionsfunktion im Laufe der Zeit techno- 
logisch verändert hat und was das für die jeweilige Ökonomie und Ökonomik 
bedeutete. Daten würden zu einer neuen Ressource, was weitreichende Konse- 
quenzen für die Produktionsfaktoren Kapital und Arbeit sowie letztlich für die 
Ordnung der neuen Digitalökonomie habe. 

In Fortführung der historischen Betrachtung hinterfragt Thomas Straub- 
haar in seinem Beitrag, ob und gegebenenfalls inwieweit das gegenwärtige 
Produktivitätsparadox mit dem Strukturwandel von Industrie- zu Datenökono- 
mien zu tun hat. Wenn bis anhin Unsichtbares sichtbar und damit erfassbar 
würde, dann könnte sich herausstellen, dass westliche Volkswirtschaften kein 
tatsächliches Produktivitäts-, sondern vielmehr ein (statistisches) Messproblem 
haben. 

Der Beitrag Felix Roths liefert weitere Argumente dafür, dass das Produk- 
tivitätsparadox mit Strukturwandel erklärt werden kann, und gibt einen Aus- 
blick auf die COVID-19-Krise. Er bietet zwei Hauptschlussfolgerungen. Zunächst 
wird der Schluss gezogen, dass ein großer Teil des Produktivitätsrätsels gelöst 
werden kann, indem immaterielles Kapital in die Vermögensgrenze der Volks- 
wirtschaftlichen Gesamtrechnung einbezogen wird. Zweitens sieht der Beitrag 
ein Post-COVID-19-Szenario vor, das höchstwahrscheinlich zu einem deutlichen 
Anstieg des Arbeitsproduktivitätswachstums führen wird. Dies hängt jedoch 
davon ab, ob der gegenwärtig stattfindende Digitalisierungsschub mit Investi- 
tionen in die Digitalisierung sowie das notwendige ergänzende (unternehmeri- 
sche und öffentliche) immaterielle Kapital flankiert wird. 

Henrique Schneider stellt in seinem Beitrag ein zweites „Rätsel der Pro- 
duktivität“ fest: Die Einschränkungen der Wirtschaft zur Eindammung der Pan- 
demie im ersten Halbjahr 2020 haben zu Produktivitätserhöhungen geführt. 
Dieser kontraintuitive Befund könnte ein Zeichen für die Entfernung der volks- 
wirtschaftlichen Statistik von der Realität der Daten- und Dienstleistungswirt- 
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schaft sein. Doch er konnte auch darauf hinweisen, wie viel Potenzial gerade in 
der Hybridisierung noch vorhanden ist. 

Der zweite Teil des Sammelbands ist der Suche nach neuen empirischen 
Verfahren für die Datenwirtschaft gewidmet. Wie lassen sich mit Hilfe von Al- 
gorithmen, künstlicher Intelligenz und selbstlernenden Maschinen ökonomi- 
sche Aktivitäten erkennen und messen? Wie kann eine Datenanalyse für Diag- 
nosen und Prognosen von Verhalten(sänderungen) in Wirtschaft, Gesellschaft 
und Politik genutzt werden? Überall und ganz besonders in den Big-Tech-Fir- 
men wird nach Antworten auf diese drängenden Fragen gesucht. Die Beiträge 
des zweiten Teils wollen diese Anstrengungen unterstützen. 

Christina Heike Maaß beschreibt in ihrem Beitrag Möglichkeiten und 
Grenzen der „Nowcast“-Voraussagen. Dabei liegt ihr Hauptaugenmerk auf bei 
neuen Methoden der Big-Data-Analyse. Wie lässt sich mit einem „Measure- 
ment without Theory“ alleine aus Datenströmen voraussagen, wie sich mak- 
roökonomische Größen verändern? Können also hochfrequente Echtzeitdaten 
ohne zugrundeliegende ökonomische Theorie nur durch Anwendung von Al- 
gorithmen zu effizienten Prognosen der Gegenwart genutzt werden? In diesem 
Beitrag werden der aktuelle wissenschaftliche Erkenntnisstand untersucht und 
das große Potenzial der Nowcast-Prognosen mit Big Data und maschinellem 
Lernen aufgezeigt. 

In ihrem Beitrag greift Silke Sturm die Frage auf, inwieweit sich Texte als 
Grundlage eignen, um ökonomische und auch politische Prozesse greifbar zu 
machen. Texte sind die am schnellsten wachsende Datengrundlage weltweit. 
Die Vernetzung und ständige Verfügbarkeit über digitale Medien ermöglicht 
Einzelpersonen ein erhöhtes Beteiligungspotenzial. Während die Vorteile auf 
der Hand liegen, ist die Auswertung mit einem höheren Aufwand verbunden 
als bei strukturierten Datensätzen. Der Beitrag greift wichtige Auswertungs- 
methoden auf und stellt exemplarisch die Möglichkeiten anhand einer Analyse 
politischer Kommunikation in Sozialen Medien dar. 

Deniz Dilan Karaman Örsal konzentriert sich in ihrem Beitrag auf die Ver- 
wendung sowohl von Textnachrichten aus den Sozialen Medien als auch von Er- 
gebnissen von Onlinesuchanfragen. Mit ihrem Beitrag zeigt sie, dass Textdaten 
aus Sozialen Medien (wie zum Beispiel Twitter oder Facebook) und Ergebnisse 
von Onlinesuchanfragen (zum Beispiel Google Trends) zunehmend in der For- 
schung und in der Praxis angesetzt werden, um makroökonomische Variablen 
vorauszusagen. Darüber hinaus stellt sie Prognoseverfahren vor, welche auf der 
Grundlage von Onlinedaten aus den Sozialen Medien und Suchmaschinen Vor- 
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aussagen von Konsumentscheidungen erlauben. Sie verdeutlicht, dass sich mit 
dem Einsatz von Onlinedaten die Prognoseverfahren verbessern lassen und die 
Entwicklungen in den Konsumentscheidungen zeitgleich abschatzbar werden. 

Im Beitrag von Niklas Scheffer, Silke Sturm und Zahurul Islam geht es um 
implizite Verhaltensmotive in der politischen Kommunikation. Implizite Motive 
spielen eine große Rolle dabei, wie unser Verhalten initiiert, aufrechterhalten 
und gestoppt wird. Sie orientieren, wählen und aktivieren unser Verhalten. Ins- 
besondere im US-amerikanischen Kontext konnte bereits nachgewiesen wer- 
den, dass sich über die Auswertung impliziter Motive Krisen oder sogar krie- 
gerische Auseinandersetzungen prognostizieren lassen. Der Beitrag stellt die 
Auswertung der Social-Media-Kommunikation deutscher Parteien (hinsichtlich 
ihrer drei Hauptmotive) durch maschinelles Lernen dar. 

Alles in allem liefern die in dem vorliegenden Sammelband vereinten Bei- 
träge einen Einstieg in eine Neuvermessung der Datenökonomie. Selbstredend 
ist das nicht das Ende, sondern bestenfalls der Anfang einer weiterführenden 
Analyse. Es gilt aufzudecken, wie tiefgreifend Big-Data-Ökonomie und Ökono- 
mik im 21. Jahrhundert verändern (werden). 
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Teil1: Das Produktivitatsparadox 
der Datenökonomie 


Die digitale Revolution: Der große Übergang in die 
Datenökonomie 


Henning Vöpel 


Die sogenannte digitale Revolution beginnt mit einem technologischen Sprung: 
Erstmals in der Geschichte der Menschheit ist es möglich, massenhaft Daten — 
„Big Data“ — zu speichern, zu verarbeiten und miteinander zu verknüpfen, und 
zwar in Echtzeit und mobil an fast jedem Ort der Welt. Mehr als vier Milliarden 
Menschen sind bereits heute per Smartphone erreichbar. Die Welt ist weder 
Scheibe noch Kugel: Sie ist technologisch und ökonomisch zu einer Plattform 
geworden. Nicht überraschend also, dass auch die Globalisierung eine neue, 
nämlich digitale Qualität der Vernetzung erfährt.! 

Dieser zunächst harmlos anmutende technologische Sprung löst eine ge- 
radezu epochale ökonomische und auch kulturelle Revolution aus. Denn Daten 
können nun genutzt werden, um Menschen, Maschinen und Infrastrukturen 
miteinander zu verbinden - alles wird „smart“. Ökonomisch betrachtet werden 
Daten dadurch zu einer Ressource, in der hohe Wertschöpfungspotenziale lie- 
gen und die nun systematisch gehoben werden können. Plattformen und Algo- 
rithmen sind die Vehikel dafür. Was noch harmlos klingt, verändert jedoch nicht 
weniger als die Ordnung der Wirtschaft.? Der folgende Beitrag ist eine grund- 
sätzliche Einführung in die Datenökonomik aus produktions- und allokations- 
theoretischer Perspektive. 


1 Vgl. allgemein zur Digitalökonomie zum Beispiel Goldfarb/Tucker (2019). 
2 Vgl. Vöpel (2018). 
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Die technologische Evolution der Okonomie: Der Ubergang von 
der Industriewirtschaft in die Datendkonomie 


Die Digitalisierung kann als zweite große technologische Revolution in der 
Wirtschaftsgeschichte verstanden werden. Die erste große Revolution war der 
Übergang von der Agrarwirtschaft in die Industriewirtschaft. Die zweite ist nun 
der Übergang von der Industriewirtschaft in die Digitalwirtschaft. Sehr stark 
stilisiert lässt sich die Evolution der Wirtschaft anhand einer makroökonomi- 
schen Produktionsfunktion darstellen (vgl. Abbildung ı). 

In der Agrarwirtschaft war der wesentliche spezifische Faktor der „Boden“. 
Eigentum an Boden bedeutete die Möglichkeit, die ökonomische Knappheits- 
rente abzuschöpfen, denn der Boden war nicht vermehrbar, sodass Produktivi- 
tätsfortschritte nicht unwesentlich diesem zufielen. Entsprechend waren nicht 
nur die ökonomischen, sondern auch die gesellschaftlichen und politischen Ver- 
hältnisse durch den Grundbesitz bestimmt. 


7 Datenwirtschaft 
Output = F (Daten, Kapital, Arbeit) 
a Industriewirtschaft 


š Output = F (Kapital, Arbeit) 
Agrarwirtschaft 


Output = F (Land, Arbeit) 


Abb. 1: Die Evolution der Wirtschaft in der Produktionsfunktion 
Quelle: Schneider/Vöpel/Weis (2018). 


Mit der Industrialisierung löste — etwas überspitzt formuliert — der Fabrikbesit- 
zer den Großgrundbesitzer als Kapitalisten ab. Kapital wurde zum bestimmen- 
den, weil relativ knappen Produktionsfaktor, der Faktor Arbeit dagegen, der vom 
Agrar- in den Industriesektor wechselte, musste anfangs - noch ungelernt und 
daher im Wettbewerb mit einer ungeheuren „Reservearmee“ aus Arbeitern ste- 
hend — zu sehr geringen Löhnen arbeiten. Die Arbeitswertlehre von Karl Marx 
sah in Kapital sogar „geronnene Arbeit“; Kapital könne nur deshalb einen Zins 
erwirtschaften, weil zuvor Arbeit ausgebeutet worden sei.? Die politische und 
gesellschaftliche Entwicklung der Wirtschaft war jedenfalls immer stark da- 
durch geprägt, wer Eigentum an der ökonomisch knappen Ressource hielt. 


? Vgl. hierzu Marx (1867), Sraffa (1975), Dow (1993). 
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Das gilt auch für den zweiten großen technologischen Übergang, jenen 
von der Industrieökonomie in die Datenökonomie. Auch dieser kommt einer Re- 
volution gleich, die nicht nur eine technologische, sondern zugleich eine ökono- 
mische, gesellschaftliche und kulturelle ist: Daten lösen das physische Kapital 
als den spezifischen Produktionsfaktor ab. Die makroökonomische Produktions- 
funktion der digitalen Datenökonomie weist somit drei Produktionsfaktoren 
auf: Arbeit, Kapital und eben Daten. Der neue Kapitalist hat nunmehr Eigentum 
an Daten. Durch Daten als neuem Produktionsfaktor verändern sich zunächst 
die produktionstheoretischen Beziehungen zwischen den Produktionsfaktoren. 


Daten versus Kapital 


Daten als Produktionsfaktor bedeuten, dass sich die Produktion und die Pro- 
dukte dematerialisieren, sie begründen die intangible Ökonomie.* Zwar werden 
immer noch Kapital und Arbeit benötigt, jedoch liegen in den Daten die nun- 
mehr spezifischen, nicht durch andere Produktionsfaktoren substituierbaren 
Informationen, weshalb den Daten — wie im klassischen „Kapitalismus“ dem 
Kapital — die ökonomische Rente zufällt. Dieser Vorgang ist bereits deutlich zu 
beobachten: Große kapitalintensive Unternehmen werden durch datengetrie- 
bene Geschäftsmodelle quasi aus dem Stand disruptiert, das physische Kapital 
wird entwertet. Folgerichtig sind heute Plattform-unternehmen wie Amazon 
oder Google die am stärksten marktkapitalisierten Unternehmen der Welt und 
haben längst die großen Energie- oder Stahlunternehmen abgelöst. 


Daten versus Arbeit 


Auch das Verhältnis zwischen Daten und Arbeit verändert sich. Musste der 
„Arbeiter“ im Kapitalismus noch vor einer Ausbeutung seiner Arbeit durch das 
Kapital geschützt werden, indem sich klassische Arbeitergewerkschaften bil- 
deten, so muss womöglich im Datenkapitalismus der Konsument vor einem 
Missbrauch seiner Daten geschützt werden, da er sonst den sich aufgrund der 
Netzwerkeffekte der Daten monopolisierenden Plattformen hilflos ausgeliefert 
ist. Darüber hinaus besteht zwischen Daten und Arbeit eine produktionstheore- 
tische Substitutionsbeziehung. Der Einsatz von Daten und künstlicher Intelli- 


4 Vgl. Haskel/Westlake (2017). 
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genz kann insbesondere kognitive Routinearbeit des Menschen ersetzen, wo- 
durch sich die Entlohnung von jahrelanger Ausbildung erheblich verringern 
könnte. Es besteht daher vielfach die Befürchtung, Digitalisierung könne zu- 
mindest übergangsweise zu technologischer Massenarbeitslosigkeit führen. 
Diese Befürchtungen sind aus historischer Perspektive unbegründet, jedoch 
wird die technologische Entwicklung sich womöglich so stark beschleunigen, 
dass auf den Arbeitsmarkt, das Bildungssystem und den Sozialstaat große Her- 
ausforderungen zukommen werden. 


Digitalökonomik: Daten, Plattformen und künstliche Intelligenz 


Daten gehen nicht allein als Produktionsfaktor in die makroökonomische Pro- 
duktionsfunktion, sondern umfassend in den volkswirtschaftlichen Produkti- 
onsprozess ein, der allgemein als Umwandlung von Ressourcen in Güter und 
Dienstleistungen verstanden werden kann (vgl. Abbildung 2). 


Ressourcen Techn./Verfahren Güter/Dienstl. 
« Arbeit e Fließband « Brot 
Kapital > Automation >i Kleidung 
Rohstoffe « Plattformen e Autos 
Energie e künstliche * Computer 
Daten Intelligenz « Daten 


Abb.2: Daten im Produktions- und Umwandlungsprozess 
Quelle: eigene Darstellung. 


Daten spielen daher auch als Outputgröße eine wichtige Rolle. Sie sind Teil 
neuer, individualisierter, das heißt kundenzentrierter und präferenzgerechter 
Dienstleistungen, sie machen selbst aus physischen Gütern wie Autos oder 
Wohnungen Services, indem sie deren Nutzung verstetigen und so die Ökono- 
mie nicht zuletzt zu einer Sharing Economy machen.5 Physische Assets lassen 
sich durch die Echtzeitnutzung der Daten weitaus effizienter nutzen, indem 
zum Beispiel Autos durch die Koordinierung und Synchronisierung von Ab- 
läufen permanent nutzbar gemacht werden können sowie Transaktions- und 
Suchkosten auf nahe null sinken. 

Mit den Daten als Input- und Outputgröße gewinnen Algorithmen und 
künstliche Intelligenz sowie Plattformen als operativ-organisatorisches Vehi- 


5 Vgl. zum Beispiel Rifkin (2014). 
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Kel der systematischen Nutzung von Daten an Bedeutung. Daten und kunstli- 
che Intelligenz sind in diesem Sinne komplementäre Produktionsfaktoren. Die 
meisten Informationstechnologien können nur in Kombination mit firmenspe- 
zifischem Kapital Wertschöpfung generieren; letzteres kann als digitales Ka- 
pital bezeichnet werden. So überrascht es nicht, dass die großen Plattformen 
nicht nur branchen- und nutzerübergreifend enorme Mengen an Daten sam- 
meln, sondern zugleich die größten Investoren in künstliche Intelligenz sind. 
Die Informationen in Daten veralten schnell, sodass deren Nutzung an die un- 
mittelbare Auswertung gekoppelt ist. Das wiederum ist nur möglich, wenn Al- 
gorithmen in der Lage sind, ungeheure Datenmengen in Nanosekundenschnel- 
le auszuwerten. In der Produktion führen Daten und Algorithmen dazu, dass 
die Skalenvorteile der Massenproduktion geringer werden und geringere Los- 
größen nun weit kostengünstiger produziert werden können. 

Daten weisen als Ressource besondere ökonomische Eigenschaften auf. 
Gelegentlich wird von Daten als dem neuen Gold oder dem neuen Öl der Da- 
tenwirtschaft gesprochen. Streng genommen ist dies falsch, denn Daten sind 
anders als Öl wieder-, gleichzeitig und mehrfach verwertbar, es besteht also 
„Nichtrivalität“ in der Nutzung. Darüber hinaus können Nutzer und Mitbe- 
werber von der Nutzung der Daten ausgeschlossen werden. Es bilden sich da- 
her private Datenunternehmen, die Daten als private Ressourcen nutzen und 
damit private Güter produzieren. Es sind jedoch oftmals Kollektivgüter, die nur 
dadurch entstehen können, dass sich mehrere Nutzer an ihrer Erstellung betei- 
ligen und so Netzwerkeffekte internalisieren. Eine Mobilitäts- oder Hotelzim- 
mer-Plattform ist umso effizienter, je mehr Nutzer sich auf ihr versammeln. 
Aufgrund dieser Netzwerkeffekte entstehen Skalierungsvorteile datenbasierter 
Geschäftsmodelle. Diese werden auf einer Plattform effizient verarbeitet, denn 
dort können sie konzentriert und optimal miteinander verknüpft werden. Platt- 
formen sind daher der „Industriekonzern“ der Digitalökonomie. 


Phänomene und Folgen der Datenökonomie 
Die beschriebenen Eigenschaften von Daten als Ressource haben weitreichende 
ökonomische und ordnungspolitische Folgen. Oberflächlich haben sich bereits 


offensichtliche Phänomene gebildet. Nachstehend sind die wichtigsten zusam- 
mengefasst und beschrieben: 


6 Vgl. Brynjolfsson et al. (2020). 
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- Es bilden sich Plattformen (Beispiele: Facebook, Amazon), da auf Plattformen 
Daten efhizient erfasst und miteinander zu neuen datenbasierten Dienstleis- 
tungen verknupft werden konnen. Plattformen werden durch die Netzwer- 
keffekte der Daten in der Tendenz immer größer, weil sie für Nutzer umso at- 
traktiver sind, je größer sie sind, vor allem sogenannter zweiseitiger Märkte.’ 

- Durch Plattformen werden Intermediäre eliminiert, da Produzenten und 
Konsumenten direkt, das heißt über die Plattformen miteinander in Kon- 
takt treten.® 

- Datenbasierte Plattformen ziehen Margen von den traditionellen Produzen- 
ten und Händlern ab, da die Information über die Konsumenten sowie deren 
Präferenzen und Verhaltensmuster nun bei den Plattformen liegt.? 

- Physische Güter werden auf Plattformen durch die Anreicherung von Daten 
zu digitalen Dienstleistungen (... as a service). Intangible Assets gewinnen in 
der Digitalökonomie dadurch massiv an Bedeutung. 

- Das physische Kapital entwertet sich durch diese Dematerialisierung zu- 
gunsten der Plattformen (Beispiele: Uber, Airbnb). 

Jenseits dieser eher oberflächlichen Erscheinungen verändert sich in der Digi- 

talökonomie die Ordnung der Wirtschaft und mit ihr die Art und Weise, wie 

Wirtschaft organisiert ist. In der Industrialisierung haben sich vertikale Wert- 

schöpfungsketten gebildet. Die großen Treiber waren Arbeitsteilung und Spe- 

zialisierung. Das klassische Industrieunternehmen war daher ein Teil einer 
komplexen Wertschöpfungskette, welches die Vorteile der Spezialisierung re- 
alisierte und über transaktionale Beziehungen zu Zulieferern und Kunden die 

Wertschöpfungskette organisierte. Ronald Coase hat diese Form des Unterneh- 

mens in seiner Theorie der Unternehmung eingehend beschrieben.!° Arbeits- 

kräfte haben sich ebenfalls spezialisiert, da die Entlohnung mit dem Speziali- 
sierungsgrad der Arbeit und entsprechend höherer Arbeitsproduktivität steigt. 

Das Prinzip vertikaler Organisation industrieller Produktion ist stark stilisiertin 

Abbildung 3 dargestellt. 


Ss 


Rysman (2009). 

Vgl. Palmatier/Moorman/Lee (2019). 

Vgl. Brynjolfsson/Hu/Rahman (2009) und Brynjolfsson/Oh (2012). 
° Vgl. Coase (1937). 
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Unternehmen 


Wertschöpfungsketten Ökosysteme 


Abb.3: Vertikale Wertschöpfungsketten versus digitale Wertschöpfungsnetzwerke 
Quelle: Schneider et al. (2018). 


Die Wertschöpfung in der Digitalökonomie ist somit nicht mehr vertikal organi- 
siert, sondern wird sich gewissermaßen „diagonalisieren“, das heißt, Branchen- 
grenzen lösen sich auf und neue Geschäftsmodelle entstehen „zwischen“ den 
klassischen Branchen. Wesentlich hierfür sind wiederum Daten, die zwischen 
den Branchen und Unternehmen Schnittstellen reduzieren und Innovations- 
potenziale für neue Prozesse und Produkte schaffen. Die hochspezialisierten, 
arbeitsteilig organisierten Unternehmen werden in der Digitalökonomie zu 
hybriden, offenen Strukturen, die in der Lage sind, agil und kollaborativ Wert- 
schöpfungspotenziale zu erkennen und zu heben. Damit ist indes ein tiefer Kul- 
tur- und Führungswandel in den tradierten Unternehmen verbunden. Digitale 
Wertschöpfung wird in Wertschöpfungsnetzwerken stattfinden, in denen die 
Erfassung und die Zuordnung von Wertschöpfung kaum mehr möglich sein 
werden. Daran knüpfen sich grundlegende rechtliche und steuersystematische 
Fragen, die hier erwähnt, aber nicht näher erläutert werden sollen, da sie über 
den Zweck dieses Beitrags weit hinausgehen. 

Darüber hinaus werden einige „klassische“ Axiome und Theoreme der 
Okonomik in Frage gestellt. Apnehmende Grenzerträge oder das Prinzip kompa- 
rativer Kostenvorteile und daraus abgeleitete Schlussfolgerungen für Speziali- 
sierung, Arbeitsteilung und Handel sind davon betroffen. Insbesondere künstli- 
che Intelligenz kann dazu führen, dass Wissen und Fähigkeiten sich replizieren 
und dadurch überall auf der Welt verfügbar gemacht werden können. Es liegt 
daher die Vermutung nahe, dass die Digitalökonomik die Art und Weise, wie die 
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globale Wirtschaft sich organisieren wird, radikal verandern und sogar funda- 
mentale Ordnungsprinzipien in Frage stellen wird. 


Ordnungsfragen der Datenökonomie 


Die Eigenschaften von Daten als Ressource und deren Nutzung durch Plattfor- 
men und Algorithmen werfen grundlegende Ordnungsfragen auf, die heute im 
Wesentlichen unbeantwortet und nicht befriedigend gelöst sind. Die wettbe- 
werbsökonomische oder zumindest ordnungspolitische Bewertung ist zunächst 
ambivalent." Zum einen ergeben sich durch die Plattformen enorme Effizienz- 
potenziale in der Koordinierung und Individualisierung von Tausch- und Pro- 
duktionsprozessen, zum anderen führen die Skalen- und Netzwerkeffekte der 
Daten zu einer Monopolisierung in der Datenökonomie, wodurch eine Re-Regu- 
lierung und eine Novellierung des Wettbewerbsrechts notwendig werden wie 
zugleich die Etablierung eines umfassenden Datenrechts, das Aspekte des Da- 
tenschutzes, der Datensicherheit und der informationellen Selbstbestimmung 
beinhaltet. Diese Fragen können hier nicht beantwortet, die Probleme nicht 
gelöst werden. Einige Bereiche können jedoch skizziert und angerissen werden. 

Die wichtigste Frage im digitalen Zeitalter stellt sich in Bezug auf die 
Ökonomisierung von Daten: Wem gehören die Daten und welche Daten sol- 
len wann, von wem und zu welchem Zweck genutzt werden können? Hier 
gilt es, den Konsumenten die Hoheit über die Daten zurückzugeben. Dies ist 
kein leichtes Unterfangen, denn die Plattformen sind bereits so groß, dass sie 
Lock-in-Effekte erzeugt haben, die es für die Konsumenten teuer machen, den 
kundenzentrierten Angeboten fernzubleiben. Generell lässt sich sagen, dass 
in Demokratien die Nutzung von Daten wohl weitaus restriktiver gehandhabt 
werden wird als in Autokratien. Grundsätzlich aber werden Gesellschaften und 
vor allem Individuen deutlich gläserner werden. Die Entscheidung darüber, wie 
gläsern, sollte jedoch weitgehend bei den Individuen selbst liegen. 

Die zweite Frage ist unmittelbar damit verknüpft: Wie lassen sich Da- 
tenschutz und Datensicherheit gewährleisten? Während große Datenmengen 
aufgrund ihrer Netzwerkeffekte enorme Effizienzpotenziale offerieren, nehmen 
zugleich damit systemische Risiken der Datensicherheit und des Datenschutzes 
zu. Im Jahr 2020 kam es zu einem „Datenleck“ in einer psychiatrischen Anstalt, 


"Vgl. allgemein zum Beispiel Varian (2005). 
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wodurch persönliche, sehr sensible Daten von Hunderten von Patienten öffent- 
lich wurden. Der ehemalige Vorsitzende des Deutschen Ethikrats, Peter Dabrock, 
bezeichnete diesen Vorgang als das „Tschernobyl der Digitalisierung“. Die sys- 
temischen Risiken von Cyberattacken oder Serverausfällen sollten durch eine 
entsprechende Dateninfrastruktur kontrolliert werden, denn diese reduziert die 
variablen Kosten für die Anwender und könnte so die Digitalisierung und deren 
Anwendungen wesentlich beschleunigen. 

Die dritte Frage bezieht sich auf das erste Vehikel der Datenökonomie, die 
Algorithmen und die künstliche Intelligenz. Diesbezüglich stellt sich die Frage: 
Wie lässt sich Transparenz über die Algorithmen herstellen? Diese Frage ist des- 
halb so wichtig, weil Algorithmen persönliche Daten sammeln, filtern und aus- 
werten und so Konsumentscheidungen beeinflussen und manipulieren kön- 
nen. Transparenz über die Art und den Umfang des Einsatzes von Algorithmen 
herzustellen ist deshalb ein wichtiger Aspekt der digitalen Regulierung. Besteht 
diese Transparenz nicht, drohen Plattformen ihre Nutzer zu kontrollieren, viel- 
leicht sogar zu manipulieren und zu diskriminieren. Shushana Zuboff nennt 
dies einen entmündigenden Uberwachungskapitalismus."3 

Die vierte Frage schließlich betrifft die Plattformen als Vehikel der daten- 
basierten Wertschöpfung selbst, denn diese haben die Tendenz, sich zu mono- 
polisieren. Zwar waren auch klassische Industrieunternehmen oft durch Skalie- 
rungsvorteile gekennzeichnet, diese nahmen jedoch irgendwann ab, während 
die Netzwerkeffekte der Daten immer weiter zunehmen, je größer Plattformen 
werden. Die vielleicht entscheidende Frage der Digitalisierung lautet: Wie lassen 
sich Plattformen sinnvoll regulieren, sodass deren Effizienz weiterhin erhalten 
bleibt, ihre Marktmacht jedoch begrenzt wird? Bislang gab es vonseiten der Re- 
gulierungsbehörden überwiegend Vorschläge zur Begrenzung der Marktmacht, 
zur Sanktionierung des Missbrauchs von Marktmacht oder zu einer verschärf- 
ten Fusionskontrolle. Auch eine Zerschlagung von zu großen und marktmäch- 
tigen Plattformen wird immer wieder ins Spiel gebracht. Selbst große Plattfor- 
men sind jedoch nicht zwingend weniger innovativ und kundenfreundlich als 
Unternehmen auf wettbewerblichen Märkten, solange die Märkte bestreitbar 
bleiben („contestable markets“), die Markteintrittskosten also gering sind, was 
bei kapitallosen Geschäftsmodellen oft der Fall ist. 


12 Vgl. Dabrock (2020). 
3 Vgl. Zuboff (2019). 
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Zudem findet der digitale Wettbewerb weniger im Guterraum statt als 
vielmehr im Datenraum. So konkurrieren heute etwa Google, Amazon oder 
Facebook um Paymentlosungen, obgleich jede Plattform fur sich eine eigene 
Marktführerschaft innehat. Die Wettbewerbsintensität zwischen Plattformen 
kann erheblich erhöht werden, wenn diese interoperational sind, die Regulie- 
rung es also für Nutzer leichter macht, zwischen unterschiedlichen Plattformen 
zu wechseln, sodass Lock-in-Effekte vermieden werden. Öffentlich betriebene 
und bereitgestellte Plattformen - im Sinne einer oben skizzierten Plattform-In- 
frastruktur — sind eher keine Lösung, eher schon genossenschaftliche Formen 
der Datennutzung, da Daten als eine Art Kollektivressource verstanden werden 
können. 


Schlussfolgerungen 


Die digitale Revolution wird zu Recht als solche bezeichnet. Denn es handelt sich 
nicht um lediglich inkrementelle Veränderungen. Die Datenökonomie stellt 
vielmehr grundlegende Ordnungsfragen, die heute bei weitem nicht gelöst 
sind. Nicht allein die disruptiven Veränderungen der Geschäftsmodelle charak- 
terisieren den Übergang von der Industrieökonomie in die Datenökonomie. Ge- 
sellschaftliche, politische, (wettbewerbs- und daten)rechtliche, regulatorische 
und kulturelle Veränderungen machen diesen Übergang zu einer epochalen 
Aufgabe, gravierende Veränderungen auf dem Arbeitsmarkt sowie in der Bil- 
dung und im Sozialstaat eingeschlossen. 
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Der Rückgang des Produktivitätsfortschritts: Worum 
geht es? 


Thomas Straubhaar 


Einleitung 


„Technologischer Fortschritt ist der Motor für langfristiges Wirtschaftswachs- 
tum.“ So kurz und knapp formulierte das Stockholmer Nobelpreiskomitee 
den theoretischen Stellenwert neuer Technologien, als es 1987 Robert Solow 
für seine wissenschaftlichen Arbeiten über ökonomische Wachstumstheori- 
en auszeichnete.! Und weiter: „Wenn nach Solows Modell ein kontinuierlicher 
technologischer Fortschritt angenommen werden kann, wird das Wachstum 
der Realeinkommen ausschließlich durch den technologischen Fortschritt be- 
stimmt.“ Also müsste im Zeitalter der Computer, der zunehmend leistungsfähi- 
geren Automaten, der Roboter, der künstlichen Intelligenz, der autonomen und 
damit wirklich auto-mobilen Fahrzeuge sowie der selbstlernenden Maschinen 
ein Wachstumsschub die hochentwickelten Volkswirtschaften immer schneller 
voranbringen. 

Die empirische Realität jedoch scheint die theoretischen Erwartungen 
zu widerlegen. Das erkannte gerade der für seine Wachstumsmodelle geehrte 
Robert Solow: „Was alle für eine technologische Revolution halten — eine dras- 
tische Verbesserung in unserem produktiven Leben — wurde überall, einschließ- 
lich Japan, von einer Verlangsamung des Produktivitätswachstums begleitet, 
nicht von einer Steigerung. Überall sind Computer zu sehen, nur nicht in den 
Statistiken der Produktivitätsmessung.“? Stand bei Robert Solows Feststellung 
das Digitalisierungszeitalter noch am Anfang — und bezog er sich neben der Te- 
lekommunikation insbesondere auf die programmierbare Automation — bestä- 


' Royal Swedish Academy of Sciences (1987; übersetzt von T. S.). 
2 Solow (1987), S. 36. 
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tigt sich die Diskrepanz zwischen Theorie und Praxis auch im Ubergang zu ei- 
ner Datenökonomie: „We see the influence of the information age everywhere, 
except in the GDP statistics“, so Brynjolfsson und Saunders.3 

Der Widerspruch zwischen theoretischer Erwartung und tatsachlicher 
Erfahrung wird als Produktivitatsparadox bezeichnet.* Damit soll beschrieben 
werden, dass sich in den letzten Dekaden das Wachstum sowohl der Arbeits- als 
auch der Totalen Faktorproduktivitat (TFP) trotz der fortlaufenden technologi- 
schen Innovationen trendmäßig verlangsamt hat.5 Durch neue Technologien 
wurde das Tempo des technischen Fortschritts offenbar in der Realität nicht be- 
schleunigt, sondern gebremst. 

Das Produktivitätsparadox ist keine Thematisierung einer abstrakten aka- 
demischen Bagatelle. Es liefert Stoff für eine höchst relevante wirtschaftspoliti- 
sche Kontroverse. Denn Konsequenz des negativen Einflusses auf die Produkti- 
vitätsentwicklung wäre es, Innovationen weit kritischer zu beurteilen, als das 
gemeinhin der Fall ist. Zeiten mit raschem technologischem Fortschritt wären 
dann nicht notwendigerweise Jahre mit hohem ökonomischem Wachstum, 
sondern könnten genauso mit Stagnation einhergehen. Genau an dieser Stel- 
le steht die aktuelle Diskussion seit Beginn der 2000er-Jahre - in einer Phase, 
in der die Statistiken trotz Roboterisierung und Automation oder künstlicher 
Intelligenz und selbstlernenden Maschinen eine Verlangsamung der Produkti- 
vitätsfortschritte wiedergeben. 

Die folgende Analyse will zunächst das Produktivitätsparadox als empiri- 
sches Phänomen darstellen. Danach werden Erklärungen dafür gesucht, warum 
die einschlägigen Statistiken in der Tat verlangsamte und nicht beschleunigte 
Produktivitätsfortschritte widergeben. Ein weiterer Abschnitt benennt ein paar 


3 


Brynjolfsson und Saunders (2009). 
* Askenazy et al. (2016). 


° Die gesamtwirtschaftliche Arbeitsproduktivität ergibt sich aus dem Verhältnis von Bruttoinlands- 


produkt (Bruttowertschöpfung) und dem Einsatz des Faktors Arbeit (gemessen entweder durch die 
Anzahl der Erwerbstätigen oder der insgesamt geleisteten Arbeitsstunden [(Arbeitsvolumen)]. Die 
Totale Faktorproduktivität setzt die Bruttowertschöpfung in Relation zu allen eingesetzten Produk- 
tionsfaktoren. Das TFP-Wachstum ergibt sich als Restgröße: „Das Wachstum der TFP wird gemessen 
als die Veränderung des BIP, die nicht durch Veränderungen des Arbeits- und Kapitaleinsatzes zu 
erklären ist. Eine Zunahme der TFP kann auftechnischen Fortschritt oder Verbesserungen der Allo- 
kation von Produktionsfaktoren in der Volkswirtschaft zurückgeführt werden.“ (Jones [2016], zitiert 
nach Sachverständigenrat [2020], S. 287). Letztlich geht es also um einen technologischen Fortschritt 
infolge von Prozess- und Produktinnovationen — der ein effektiveres Zusammenspiel der Produktions- 
faktoren (in der Regel Arbeit und Kapital) ermöglicht (vgl. dazu insbesondere Sachverständigenrat 
[2015], S. 284-285). 
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herkommliche Erklarungen fur das Produktivitatsparadox und argumentiert, 
dass die „säkulare Stagnation“ wenig mit fehlendem Fortschritt zu tun habe, 
sondern Folge des strukturellen Übergangs von einer Industrie- erst zu einer 
Dienstleistungs- und danach zu einer Datenwirtschaft sei. 

Der darauffolgende Abschnitt postuliert, dass westliche Volkswirtschaften 
weniger ein Produktivitäts- als vielmehr ein Messproblem haben. Es war immer 
schon ein grundsätzliches Problem der Wirtschaftsstatistik, dass sie zunächst 
nicht in der Lage ist, die Folgeeffekte von Basisinnovationen abzubilden. Wie 
auch? Für viele der von Raum und Material losgelösten Neuerungen der Di- 
gitalisierung fehlen schlicht (noch) die gesamtwirtschaftlichen statistischen 
Maßzahlen. 

Der letzte Abschnitt zieht ein Fazit. Er verweist auf die Notwendigkeit, bis 
anhin „Unmessbares“ messbar zu machen. Es bedarf einer fundamentalen An- 
passung der makroökonomischen Statistik. Ansonsten droht der Wirtschafts- 
politik zunehmend ein Stochern im Nebel der Unschärfe und Ungenauigkeit. 


Empirie: Der Produktivitätsfortschritt wird langsamer 


Der empirische Befund ist eindeutig: „Für Deutschland zeigt sich langfristig ein 
deutlicher Rückgang des Wachstums der Totalen Faktorproduktivität. Haupt- 
sächlich spiegelt sich darin der verlangsamte technologische Fortschritt wi- 
der.“ Eine mehr oder weniger ähnliche Verlangsamung der TFP zeigt sich in den 
meisten ökonomisch höher entwickelten Volkswirtschaften.® 

Wie Abbildung ı veranschaulicht, lag das durchschnittliche jährliche 
Wachstum der TFP in den 1970er-Jahren noch bei über zwei Prozent. In den 
1980er-Jahren erreichte es 1,5 %, in den 1990er-Jahren ein Prozent. Seit der Jahr- 
hundertwende verharrt es bei etwas mehr als 0,5 %, was auch der Prognose für 
den Zeitraum bis 2024 entspricht.’ 


6 vgl. dazu ausführlich und kompetent Grömling (2016). Amtliche Statistiken erheben Daten 
zwangsläufig auf veralteten Grundlagen. Es kann nur Bekanntes gemessen werden, wofür es „Klas- 
sifikationen“ gibt. Das Neue ist so unbekannt, dass es — mindestens zu Beginn - nicht mit gängigen 
Konzepten erfassbar ist. 

7 Sachverstandigenrat (2019), S. 95. 

® Vgl. dazu die einzelnen Beiträge in Askenazy et al. (2016) und für die USA im Speziellen Gordon 
(2016). 

>? Sachverständigenrat (2019), S. 95. 
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Trendwachstum der Totalen Faktorproduktivitat 
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Abb. 1: Trendwachstum der Totalen Faktorproduktivität (Deutschland, 1971 bis 2024) 


Quelle: Sachverständigenrat (2019), $. 95. 


Kein Wunder ist es, dass angesichts der stetigen Verlangsamung des Wachstums 
der TFP die alte Hypothese einer „säkularen Stagnation“ neue Nahrung erhält. 
Denn bereits vor einem Jahrhundert führte eine lange Phase schwachen öko- 
nomischen Wachstums mit entsprechend negativen Rückwirkungen auf den 
durchschnittlichen Lebensstandard zu besorgtem Interesse. „Was können wir 
vernünftigerweise erwarten, auf welchem Niveau der Wohlstand in hundert 
Jahren liegen wird? Was sind die wirtschaftlichen Möglichkeiten für unsere En- 
kelkinder?“, fragte John Maynard Keynes 1930 in Zeiten großer ökonomischer 
wie politischer Not und grassierender Zukunftsängste.10 

In seinem Ausblick auf die wirtschaftlichen Chancen und Risiken für 
nachfolgende Generationen sah sich Keynes — angesichts der damaligen Kri- 
se nicht wirklich überraschend - einer skeptischen Perspektive seiner Zeitge- 
nossen gegenüber: „Wir leiden gerade jetzt unter einer bösartigen Attacke des 
ökonomischen Pessimismus. Überall ist zu hören, dass die Epoche des enormen 


10 Keynes (1930) fasst in seinem 1930 veröffentlichten Essay „Economic Possibilities for our Grand- 
children“ eine Vorlesungsreihe zusammen, in der er auch seine Erkenntnisse zur Großen Depression 
der Zwischenkriegszeit verarbeitete. 
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wirtschaftlichen Fortschritts, der das vergangene Jahrhundert kennzeichnete, 
vorbei sei; dass die rasche Verbesserung des Lebensstandards sich fortan ver- 
langsamen werde; dass in dem vor uns liegenden Jahrzehnt ein Ruckgang des 
Wohlstands wahrscheinlicher sei als eine Verbesserung.“!! Führende Intellek- 
tuelle sagten der Weltwirtschaft in den 1930er-Jahren eine lange anhaltende 
„säkulare“ Stagnation voraus.!? Der Menschheit stehe für Dekaden ein ökono- 
misches Nullwachstum bevor. 

Die Empirie hat den Pessimismus von damals als klare Fehlprognose ent- 
larvt. Der Wohlstand der Massen hat nicht ab-, sondern zugenommen - und 
zwar weltweit. Mehr Menschen als jemals zuvor leben heutzutage besser als 
ihre Eltern und Vorfahren. Dennoch erscheint es, als hätte Keynes vor fast 100 
Jahren nicht allein den Zukunftspessimismus von damals, sondern bereits die 
Ängste der Gesellschaft der Gegenwart im Auge gehabt. Denn schon lange vor 
dem Schrecken, den die Coronapandemie Anfang der 2020er-Jahre verbreitete, 
kehrten das Produktivitätsparadox und mit ihm die Sorge vor einer „säkularen 
Stagnation“ ins Bewusstsein der Makroökonomik zurück. 

So sah Lawrence Summers, einst Finanzminister unter US-Präsident Bill 
Clinton und später unter Barack Obama Direktor des National Economic Coun- 
cil, die Welt nach der Finanzmarktkrise Ende der Nullerjahre erneut vor einer 
langen Phase schwachen ökonomischen Wachstums mit entsprechend negati- 
ven Rückwirkungen auf den durchschnittlichen Lebensstandard." Viele andere 
Ökonomen teilen das Urteil, dass trotz oder gerade wegen der Digitalisierung 
und deren Folgen der Produktivitätsfortschritt sich in den vergangenen Deka- 
den Schritt für Schritt verlangsamt habe und sich weiter abschwächen werde.!4 
Hierfür wird eine Reihe von Ursachen verantwortlich gemacht, auf die nun nä- 
her eingegangen wird." 


"Keynes (1930), erster Abschnitt. Übersetzung durch T. S. 


2 Der Begriff der „säkularen Stagnation“ wurde ursprünglich von dem Harvard-Ökonomen Alvin 
Hansen in den 1930er-Jahren geprägt (Hansen 1938) und dann von John Maynard Keynes aufgegriffen, 
der sich Sorgen machte, dass das durch eine — auch bereits damals — schrumpfende Bevölkerung 
verursachte Ungleichgewicht zwischen Sparen und Investieren zu einem längerfristigen Wachs- 
tumsschwund führen könnte. 


3 Summers (2014, 2016). 
14 Gordon (2014) ist dabei einer der führenden Vertreter der Stagnationsthese. 


3 In der Studie der Bertelsmann Stiftung (2020) finden sich ein ausführlicher Überblick zum Pro- 
duktivitätsbegriff und seinen Entwicklungsfaktoren sowie ein umfangreiches Literaturverzeichnis 
mit den wichtigsten Quellen. 
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Herkömmliche Erklärungen des verlangsamten Wachstums der 
Totalen Faktorproduktivität 


Kompositionseffekt 


Das verlangsamte TFP-Wachstum ist zunächst eine zwangsläufige Begleiter- 
scheinung, die in Deutschland untrennbar mit dem „German Job Miracle“!6 
einhergeht — also der immensen Beschäftigungserfolge der letzten fünfzehn 
Jahre. Zwischen 2005 (mit einer jahresdurchschnittlichen Erwerbspersonenzahl 
von rund 39 Millionen) und 2020 (mit einer Erwerbspersonenzahl von rund 45 
Millionen vor Ausbruch der Coronapandemie im ersten Quartal 2020) sind in 
Deutschland rund sechs Millionen zusätzliche Erwerbstätige in den Arbeits- 
markt integriert worden.” 

Kehrseite des Anstiegs der Erwerbsverhältnisse ist die plausible Annahme, 
dass die neu beschäftigten Personen zuvor (als Massen von auch vergleichswei- 
se gut Qualifizierten Arbeit suchten) ihre Fähigkeiten nicht erfolgreich auf dem 
Arbeitsmarkt einbringen konnten, „sodass davon auszugehen ist, dass sie insge- 
samt weniger produktiv waren als der durchschnittliche Erwerbstätige im Jahr 
2005."18 Mit dem Zugang von weniger produktiven Erwerbspersonen in den 
Arbeitsmarkt dürfte die durchschnittliche Produktivität gesunken sein, was als 
„Kompositionseffekt“ bezeichnet wird. 

Der „Kompositionseffekt“ erklärt und relativiert auch etwas die Folgen der 
Arbeitsmarktreformen seit Mitte der Nullerjahre. Die Politik des „Förderns und 
Forderns“ war darauf ausgerichtet, möglichst viele Personen in Arbeit zu brin- 
gen. Arbeit sollte sich mehr lohnen, als arbeitslos zu bleiben. Entsprechend wurde 
das Anrecht auf staatliche Unterstützung verkürzt und verschärft, und wer ar- 
beitslos war, musste auch vergleichsweise schlechter bezahlte Jobs akzeptieren. 
Insbesondere wurde die Beweislast umgekehrt. Nicht mehr die Arbeitsagentur 


6 Economist (2013). 
17 Daten aus IAB (2020). 
18 Sachverstandigenrat (2015), S. 288. 


19 Sachverstandigenrat (2016), S. 129. Der „Kompositionseffekt“ ist — mit gegenteiligem Vorzeichen — 
das Gegenstück zur „Entlassungsproduktivität“, die entsteht, wenn eine gegebene Wertschöpfung 
mit deutlich weniger Erwerbstätigen erbracht wird, was die (Arbeits-)Produktivitat ansteigen lässt. 
Diese „Verwandtschaft“ erklärt auch sich auf den ersten Blick scheinbar widersprechende empiri- 
sche Ergebnisse - siehe dazu die nachfolgenden Beiträge von Roth (2021) und von Schneider (2021) 
in diesem Sammelband. 


Der Rückgang des Produktivitätsfortschritts: Worum geht es? 47 


musste nachweisen, dass bestimmte Tätigkeiten zumutbar waren. Vielmehr lag 
es nun an den Arbeitslosen, zu belegen, wieso ihnen die Annahme eines offenen 
Stellenangebots unzumutbar sein sollte. Im Ergebnis nahm die Beschäftigung in 
Deutschland rasant zu, aber bei vergleichsweise nur moderat steigenden Löhnen. 

Eine lange Periode der Lohnzurückhaltung — wie sie für eine gewisse Zeit 
in Deutschland typisch war — muss jedoch nahezu zwangsläufig mit niedrigen 
Produktivitätszuwächsen einhergehen.?° Die Logik hinter dieser Erwartung ist 
simpel: Wenn Arbeit billig(er) ist, unterbleiben betriebswirtschaftliche Anreize, 
in Maschinen, Roboter und neue digitale Technologien zu investieren. Warum 
aufteure Automaten setzen, wenn Arbeit so billigist? Entsprechend unterbleibt 
ein Modernisierungsschub. Es wird mit billiger Arbeitskraft zu arbeitsintensiv, 
mit zu viel Arbeit und zu wenig Kapital produziert, was eben dazu führt, dass 
die Arbeitsproduktivität eben nur vergleichsweise langsam ansteigt. Anstelle 
von Robotern werden Menschen beschäftigt, anstatt künstliche Intelligenz ein- 
zusetzen, werden Personen beansprucht. Das Ergebnis: viele Jobs, aber wenig 
Innovation und somit geringe Arbeitsproduktivität und schlechte Bezahlung.” 


Strukturwandel 


Eine Verlangsamung der Produktivitätsentwicklung kann ebenso das Ergeb- 
nis einer strukturellen Verschiebung weg von hochproduktiven Wirtschafts- 
bereichen wie dem Verarbeitenden Gewerbe hin zu Bereichen mit geringerer 
Produktivität sein, wie sie in vielen Dienstleistungsbereichen zu verzeichnen 
ist. Das „Forellenquintett“ von Franz Schubert liefert hierfür eine Veranschau- 
lichung. Die Arbeitsproduktivität der fünf Musizierenden ist — allem techni- 
schen Fortschritt zum Trotz — auf Punkt und Komma genau dieselbe wie vor 
200 Jahren bei der Uraufführung. Wie zu Schuberts Zeiten lassen sich weder 
Klavier, Violine, Viola oder Violoncello noch Kontrabass einsparen - alle fünf 
Musizierenden sind unverzichtbar — gestern genauso wie heute und morgen, 
neue Technologien hin oder her. Und ebenso wenig kann einer der fünf Sätze 
fallengelassen werden. Bestenfalls lassen sich die Pausen zwischen den Sät- 
zen kürzen und kann etwas rascher gespielt werden. Aber insgesamt dürfte die 


2° Empirische Belege für diese These finden sich bei Vergeer und Kleinknecht (2014). 
21 Vgl. hierzu Kleinknecht (2017). 
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Spieldauer von 38 Minuten höchstens um ein paar wenige Sekunden verkürzt 
werden. Ein Produktivitätsfortschritt jedoch sieht völlig anders aus. 

Was für die Musizierenden gilt, trifft natürlich auf eine Vielzahl von Akti- 
vitäten im Dienstleistungswesen gleichermaßen zu. Lehrkräfte können ihre Ar- 
beitsproduktivität prinzipiell nicht steigern. Wie auch? Wohl könnte die Anzahl 
der zu Unterrichtenden pro Ausbildungsstunde erhöht werden. Das würde zwar 
in den Statistiken als Produktivitätsanstieg verbucht. In der Realität allerdings 
dürfte die Qualität des Unterrichts schlechter und nicht besser werden, wenn 
anstelle von 20 Kindern 30 in derselben Schulklasse oder Kindergruppe sitzen. 

Gleiches zeigt sich im Gesundheitswesen. Da werden Algorithmen die Pro- 
duktivität der Ärztinnen und Ärzte bei Problemerkennung, Diagnose und Thera- 
pie gewaltig steigern, weil viel Bürokratie, Wiederholung, Papierkram entfallen 
und künstliche Intelligenz menschliches Suchen nach Ursachen und Wirkungen 
verbessert. Aber bereits in der Betreuung und Beratung, in der Krankenpflege und 
erst recht in der Altenpflege oder Psychiatrie wird es schwieriger, persönliche An- 
teilnahme, Empathie oder Seelsorge durch Roboter und Maschinen zu ersetzen. 

Während in Bürokratie und Verwaltung durch digitales Datenmanage- 
ment sogar ein enormer Produktivitätssprung möglich wäre, ist bei Polizei und 
Notfalldiensten eine weitere Personaleinsparung kaum mehr möglich, ohne die 
Qualität der Daseinsvorsorge und des öffentlichen Angebots zu verschlechtern. 
Das dürfte auch bei vielen staatlichen, kommunalen oder kirchlichen Stellen 
wie Sozialeinrichtungen, Tagesstätten und Kinderheimen oder im Justiz(voll- 
zugs-)wesen, im Kulturbereich und bei Freizeit und Sport zutreffen. Im Fußball 
waren es immer 22 Spielende und die Anzahl der Offiziellen ist gestiegen und 
nicht etwa gesunken, gerade auch neuer Technologien wie beispielsweise des 
Videobeweises wegen. 

Das Beispiel des Forellenquintetts veranschaulicht, dass mit dem Struktur- 
wandel von der kapitalintensiven Industrie- zur arbeitsintensiven Dienstleis- 
tungsgesellschaft die gesamtwirtschaftliche (Arbeits-)Produktivitat zwangsläu- 
fig langsamer vorankommt. Die im höchsten Fall geringe Steigerungsfahigkeit 
der Arbeitsproduktivität gehört zum Wesen vieler Dienstleistungen. Und noch 
etwas wird ersichtlich, wenn man sich klar macht, dass die Produktivitätsmes- 
sung zwei Komponenten verknüpft. 

Zum einen geht es bei der Arbeitsproduktivität (und deren Entwicklung) 
um das Reale, also darum, was tatsächlich geschaffen, produziert oder musiziert 
wird. Da hat sich beim Forellenquintett in 200 Jahren gar nichts getan. Die Sta- 
tistik kann hier nur ewige Stagnation messen. 
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Dann jedoch geht es um das Monetare, also darum, was Produkte, Leistun- 
gen und Musikgenuss kosten. Musikliebhaber sind heute bereit, ein Vielfaches 
dessen zu zahlen, was zu Beginn des 19. Jahrhunderts üblich war, obwohl das 
Forellenquintett um kein Jota anders ist als damals. Ganz offenbar wird heut- 
zutage der Wert eines Konzertbesuchs höher eingeschätzt als vor 200 Jahren. 
Gründe für die höhere Zahlungsbereitschaft der Kunden finden sich in geänder- 
ten Vorlieben, daneben aber vor allem auch im allgemein höheren Wohlstand 
— was nun wiederum eine Folge dessen ist, dass sich in der Industrie und bei 
spezialisierten Dienstleistungen durchaus der technische Fortschritt positiv 
bemerkbar macht, was das Lohnniveau allgemein ansteigen lässt. Im Ergebnis 
kommt es in der Statistik zu einer indirekten und damit nur bescheidenen Zu- 
nahme der Arbeitsproduktivität auch der Musikerinnen und Musiker, die das 
Forellenquintett darbieten - selbst wenn das Reale völlig unverändert dasselbe 
geblieben ist. 

Spätestens hier wird deutlich, dass die Verhältnisse in Deutschland nicht 
durch ein Produktivitätsparadox, sondern durch ein Dienstleistungsparadox ge- 
kennzeichnet sind. Solange sich hierzulande die Wertschätzung für eine gute Qua- 
lität der Dienstleistungen nicht in entsprechender Bezahlung ausdrückt, solange 
also im Gesundheits-, Bildungs- und Sozialwesen, bei öffentlichen Dienstleistun- 
gen oder in Kunst und Kultur die Löhne nicht stärker steigen, wird die Arbeitspro- 
duktivität im Kriechgang oder überhaupt nicht vorankommen. Und wenn sich da 
nichts ändert, werden Roboter und künstliche Intelligenz das scheinbare Produk- 
tivitätsparadox vergrößern und nicht verkleinern, da sie die Arbeitsproduktivität 
für wenige erhöhen, nicht jedoch für die Masse der Dienstleistenden. Wirkliche 
Abhilfe bringt da deshalb nur eines: Dienstleistungen so hoch zu schätzen, wie es 
für eine auf Qualität setzende Gesellschaft unabdingbar ist. 


Digitalisierung und immaterielle Wertschöpfung 


Mit der strukturellen Transformation von der physischen Industrie- zur güter- 
losen Dienstleistungs- und nun zur digitalen Wissens- und Datenökonomie än- 
dert sich das Wesen der Ökonomie fundamental. Insbesondere führte die digi- 
tale Transformation der vergangenen Dekaden zu einer steigenden Bedeutung 
immaterieller Produktionsfaktoren.?? Der Anteil von Investitionen in immateri- 


22 Vgl. hierzu Corrado et al. (2009) und (2012) sowie den Beitrag von Roth (2021) in diesem Band. 
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elle Produktionsfaktoren an der Bruttowertschöpfung stieg zwischen den Jah- 
ren 1995 und 2016 in Deutschland und den USA um etwa 2 Prozentpunkte und 
in Frankreich um etwa 4 Prozentpunkte an.?3 

Zu den immateriellen Sachverhalten, die mit Digitalisierung und Da- 
tenökonomie einhergehen, gehören auch mikroökonomische Prozesse, die mit 
der Adoption von und Adaption an neue Technologien zu tun haben. Dazu ge- 
hören insbesondere auch auf andere Bereiche überschwappende Wirkungen 
(spillovers), die als positive externe Effekte Prozesse und Abläufe verbessern. 

Das Hauptproblem der Zunahme der immateriellen Wertschöpfung liegt 
darin, dass deren Beitrag zur gesamtwirtschaftlichen Wertschöpfung nicht 
gemessen, sondern nur geschätzt werden kann. Damit jedoch verschiebt sich 
deren statistische Erfassung von der Realität in die Welt abstrakter Modelle. 
Es sei noch einmal daran erinnert, dass das Wachstum der TFP in aller Regel 
als Restgröße (als sogenanntes Solow-Residuum) berechnet wird, und zwar als 
nicht direkt erklärbare Wertschöpfung, die sich ergibt, „nachdem vom berech- 
neten Produktionswachstum die gemessenen Veränderungen der einzelnen 
Produktionsfaktoren, gewichtet mit ihren Produktionselastizitäten, abgezogen 
wurden.“?4 Wie anfällig derartige residuale Schätzverfahren für Fehler aller Art 
sind, dürfte offensichtlich sein.25 


Daten sind anders zu messen als Waren 


Daten sind wie Dienstleistungen und Wissen nicht dinglicher Natur. Das macht 
es für die Statistik so schwierig, sie zu erfassen. Deshalb tun sich herkömmliche 
Verfahren zur Messung ökonomischer Aktivitäten so schwer. Daten wabern vir- 
tuell und „undinglich“, losgelöst von Standorten im In-und Ausland durch Inter- 
net und Orbit. Eine geografische Abgrenzung von Herkunft, Verarbeitung, Ver- 
marktung und Nutzung wird dadurch nahezu vollständig unmöglich gemacht. 
Information und Kommunikation beruflicher Art, aber auch innerhalb sozialer 
Netzwerke, lassen sich nur schwerlich an nationalen Grenzen aufhalten, auch 
nicht, wenn Zollstationen errichtet oder Schutzmauern verstärkt werden. 


23 Sachverstandigenrat (2019), S. 165. 
4 Sachverständigenrat (2019), S. 90. 
25 Vgl. dazu Jacobs und van Norden (2015), zitiert nach Sachverstandigenrat (2015), S. 284. 
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Daten sind um Dimensionen rascher hin und her zu bewegen als Güter, 
aber auch als Dienstleistungen, bei denen sich entweder Patienten in die Praxis 
oder Ärzte zu den Patienten nach Hause begeben müssen. Bei Onlinebehand- 
lungen erfolgt eine Beratung aus der Ferne. Telemedizin erlaubt, Operationen 
durchzuführen, bei denen die Chirurgin Tausende von Kilometern weit entfernt 
vom Patienten das Skalpell fernsteuert. Künftig werden mit Datenbanken ver- 
bundene implantierte Sensoren und mithilfe von Algorithmen dafür sorgen, 
dass Herzschrittmacher, Insulinpumpen, Blutdruckregler und vieles andere 
mehr automatisch und ohne das Zutun Dritter das auslösen, was medizinisch 
geboten scheint. Dass sich damit eine Reihe von juristischen Verantwortlich- 
keits- und Haftungsfragen völlig neu stellt, ist offensichtlich. Genauso klar wird, 
dass digital erbrachte Dienstleistungen eine neue Form der statistischen Erfas- 
sung erforderlich machen und insbesondere (räumliche) Abgrenzungsproble- 
me zu bewältigen sind. 


Messfehler als Erklärung 


Mit den rasanten Veränderungen von Datenwirtschaft und Digitalisierung ver- 
mag das BIP nicht mitzuhalten. Das Bruttoinlandsprodukt (BIP) als heutzutage 
in Ökonomie und Ökonomik unverändert mit Abstand wichtigster Maßstab 
zur Messung wirtschaftlicher Aktivitäten ist auf Volkswirtschaften ausgerich- 
tet, die sich nach Maßgabe von Landesgrenzen trennen lassen. Erfasst werden 
Raum und Zeit zurechenbare, territorial nach Gemeinden, Regionen oder Staa- 
ten abgrenzbare wirtschaftliche Tätigkeiten, die Werte schaffen oder für Ein- 
kommen oder Umsätze sorgen. Bereits beim Einbezug „öffentlicher“ Güter (für 
die es keine Marktpreise gibt), muss mangels direkter Messverfahren auf indi- 
rekte Hilfsberechnungen ausgewichen werden (was gerade wegen des steigen- 
den „öffentlichen“ Charakters der Wertschöpfunginnerhalb von Digitalisierung 
und Datenökonomie ein zunehmendes Problem darstellen dürfte). 

Die Wertschöpfung der Datenökonomie wird nur rudimentär einbezo- 
gen.?° Deshalb sind die Mängel des BIP und der Verfahren zu seiner Messung 
im Zeitalter von Digitalisierung, Datenwirtschaft, Algorithmen und künstlicher 


26 Brynjolfsson und Saunders (2009) sowie Brynjolfsson und Oh (2012). Brynjolfsson et al. (2019) 
entwickeln mit dem GDP-B einen Ansatz, mit dessen Hilfe sich der Nutzen (und eben nicht Umsät- 
ze oder Kosten wie beim herkömmlichen BIP-Konzept) der Digitalwirtschaft und Datenökonomie 
mikroökonomisch messen und makroökonomisch hochrechnen lässt. 
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Intelligenz bedeutender denn je.” Weder Entdinglichung, Entterritorialisierung 
noch Entstaatlichung findet sich in den gängigen Statistiken zur Erfassung wirt- 
schaftlicher Aktivitäten wieder. Das BIP ist in keiner Weise geeignet, den zuneh- 
menden Stellenwert der Datenwirtschaft oder hybrider digitaler Staatlichkeit 
oder immaterieller Wertschöpfung in adäquater Weise abzubilden. Deshalb 
dürften die BIP-Statistiken die tatsächliche Entwicklung unterschätzen.?® 

Wie soll das BIP, das Maß aller statistischen Dinge, das Unmessbare mess- 
bar machen? Wenn die Zukunft so anders als die Vergangenheit sein wird, Din- 
ge sich so schnell und so fundamental ändern, wie das mit den durch Digitali- 
sierung und Datenökonomie verursachten Veränderungen der Fall sein dürfte, 
wenn viele Entwicklungen heutzutage noch unsicher sind und unsichtbar er- 
folgen, weil sie sich in den virtuellen Clouds des weltweiten Internet abspielen 
oder — und viel banaler - wenn sich Austausch und Handel der statistischen 
Erfassung entziehen, weil vieles nicht (mehr) über Märkte gekauft, sondern zwi- 
schen Haushalten geteilt und getauscht wird, wie es typisch ist für eine Sharing 
Economy, in der es um die Nutzung und nicht das Besitzen geht — wenn das 
alles mehr oder weniger gleichzeitig passiert, dann entstehen mit Statistiken 
und Maßzahlen, die für eine ganz andere Welt vergangener Zeiten entwickelt 
wurden, echte Messprobleme. 

Für viele mit der von Raum und Material losgelösten Neuerungen der Di- 
gitalisierung fehlen schlicht (noch) die gesamtwirtschaftlichen statistischen 
Maßzahlen. Informationsgüter mit Netzwerkcharakter werden bestenfalls teil- 
weise erfasst. Wenn moderne Apps oder Plattformen wie Uber, Car to Go oder 
Airbnb eine Sharing Economy und damit eine weitaus effizientere Ausnutzung 


27 Die statistischen Ämter behelfen sich bei der BIP-Ermittlung, in dem sie den Wert der durch die 
Digitalisierung geschaffenen Wertschöpfung oder den durch digitale Güter und Dienstleistungen 
entstehenden Nutzen oder Umsatz mit Plausibilitätsüberlegungen schätzen und nach neuen Ver- 
fahren suchen (vgl. dazu Anmad/Ribarsky/Reinsdorf [2017] sowie Anmad/Schreyer [2016]). So aber 
verlagert sich beim BIP die Erfassung noch weiter weg von der Marktorientierung hin zur Modellwelt 
der Statistik. Damit aber steigt die Gefahr, mit künstlich geschaffenen Zahlen den Bezug zur „gemes- 
senen“ Realität zu verlieren. Das gilt natürlich — bei allen Vorteilen — auch für das GDP-B-Konzept von 
Brynjolfsson et al. (2019). 


28 Richtig ist jedoch auch, dass „ein Teil der neuen Güter nicht in den Volkswirtschaftlichen Gesamt- 
rechnungen erscheint, die negative Substitutionseffekte jedoch dort voll sichtbar sind” (Gromling 
2016), S. 139. So steigt die im BIP nicht abgebildete Konsumentenrente an, da Menschen digitale 
Dienste zu Preisen weit unter ihrer Zahlungsbereitschaft erhalten. Ebenso wird ein Teil dieser re- 
alen Steigerung der Kaufkraft der Haushalte durch eine nahezu kostenlose Ubertragung eigener 
persönlicher Daten finanziert, was wiederum bei den Firmen nicht als (Datenbeschaffungs-)Kosten 
verbucht wird. 
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vorhandener Güter, Autos oder Wohnungen ermöglichen, bildet das BIP die 
Auswirkungen, wenn überhaupt, so nur mit rudimentären Naherungen ab.?9 

Eine beachtliche Fülle von Konsumgütern wird im Internet nahezu kos- 
tenlos zur Verfügung gestellt. Alles, was keine Umsätze erzielt, erscheint jedoch 
nicht im BIP Vieles davon ersetzt aber den Kauf alternativer Marktprodukte, die 
im BIP erfasst waren. Wenn Wikipedia den Zugriff zu einem Onlinelexikon und 
YouTube das Abspielen von Videos und Filmen ermöglicht oder wenn Nerds 
ihre selbstentwickelten Spiele, Softwares, Musikvideos oder Fotos für die Allge- 
meinheit im Netz anbieten, dann erhalten die Nutzerinnen und Nutzer etwas, 
ohne dafür nennenswert bezahlen zu müssen. Aber obwohl die Zufriedenheit 
oder das Wohlbefinden der Menschen zunimmt, fällt das BIP, weil weniger Lexi- 
ka oder DVDs gekauft werden. Gleiches gilt, wenn kostenpflichtige Printmedien 
durch frei zugängliche elektronische Nachrichtenportale ersetzt werden. Dann 
erhalten Menschen billiger, schneller und einfacher Zugang zu Informationen. 
Das BIP jedoch sinkt, weil traditionelle Medien wie Zeitungen und Zeitschriften 
Umsatzeinbußen erleiden, was zu Entlassungen und geringerer Wertschöpfung 
führt.?° 


Schlussfolgerungen: Neuvermessung der Datenökonomie 


Die Wertschöpfung im Internet, der virtuelle Handel mit digitalen Daten sowie 
die Effekte einer Sharing Economy, in der gerade teure und langlebige Güter 
— wie Wohnungen, Autos oder Elektrogeräte — gemeinsam genutzt und nicht 
selbst erworben werden, entziehen sich in beachtlichen Teilen der sachlichen 
Erfassung, räumlichen Zuordnung und zeitlichen Abgrenzung. Deshalb sind 
das BIP und seine Messverfahren von geringerer Aussagekraft denn je. Das zu 
erkennen, ist nicht nur eine minimale Anforderung an die Wissenschaft, die 
nach neuen und besseren Methoden zu suchen hat. Es muss auch Öffentlichkeit 
und Medien vermittelt werden, wie unsinnig es geworden ist, sich beim BIP um 
marginale Schwankungen hinter dem Komma Gedanken zu machen oder gar 
Sorgen oder Euphorie zu verbreiten, wenn grundsätzliche Probleme das ganze 
Konzept in Frage stellen. 


29 Vgl. hierzu Demary (2015) sowie Zervas/Proserpio/Byers (2017). 


3° Zu dem Produktivitätsparadoxon, dass sich das BIP zunächst abschwächt, bevor es später zu- 
nimmt, vgl. Triplett (1999) sowie Grömling (2016) und Van Ark (2016). 
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»Measuring the Digital Transformation“ lautet der Titel einer aktuellen 
OECD-Publikation, die danach strebt, aufzuzeigen, wie sich der Wert von Daten 
messen und in die gängigen Statistiken zur Erfassung ökonomischer Aktivitä- 
ten einbinden lässt. Quintessenz der OECD-Analyse ist, dass, „as existing metrics 
and measurement tools struggle to keep up, it is imperative to act now. ... More 
must be done to strengthen the evidence base needed to monitor and shape the 
digital transformation.”?! 

In welche Richtung sich neue Messkonzepte entwickeln sollten, um ei- 
ner digitalisierten Datenökonomie Rechnung zu tragen, zeigen die neuen Da- 
tenquellen und Methoden, die das Statistische Bundesamt seit Anfang der 
2020er-Jahre unter der Rubrik „Experimentelle Daten“ zusammenfasst.?? So 
werden nun Umsatzsteuervoranmeldungen, Kreditvergaben und Auskünfte 
für Onlinetransaktionen oder Mobilfunkdaten (zur Ermittlung eines tagesaktu- 
ellen Mobilitätsindikators) erfasst. Aus Satellitendaten, die das Schiffsaufkom- 
men und die Zahl der Container in Häfen aufdecken, lassen sich Rückschlüs- 
se in Echtzeit auf Handelsaktivitäten und Produktionszahlen ziehen. Genauso 
können Satellitenbilder zeigen, wie dicht Parkplätze vor Geschäften belegt sind, 
was tagesaktuelle Erkenntnisse zu Konsumverhalten und Umsatzzahlen er- 
möglicht. Das Bundesamt für Güterverkehr hat aus digitalen Prozessdaten der 
Lkw-Mauterhebung einen Lkw-Maut-Fahrleistungsindex entwickelt, der früh- 
zeitig (innerhalb einer guten Woche) Anhaltspunkte zur Entwicklung der Indus- 
trieproduktion liefert. 

Desgleichen veröffentlicht die Deutsche Bundesbank mit dem wöchent- 
lichen Aktivitätsindex (WAI) einen Index, der die realwirtschaftliche Aktivität 
in Deutschland möglichst zeitnah messen soll.33 Er basiert auf Stromverbrauch, 
Lkw-Fahrleistungen, Flugbewegungen, Google-Suchanfragen, Passantenauf- 
kommen, Luftverschmutzung und Verbraucherbefragungen. 

Mit diesen modernen und Big Data angemessenen Experimenten sol- 
len Echtzeitentwicklungen rascher sichtbar gemacht werden. Aber so begrü- 
ßenswert die Initiativen des Statistischen Bundesamts und der Deutschen 
Bundesbank auch sind, so sehr kratzen sie bestenfalls an der Oberfläche eines 
statistischen Eisbergs, dessen massiger Kegel weiterhin in der Dunkelheit der 
Nichterfassung liegt. Onlinemarktplätze für Unterkunft (Vermietung, Haus- 


31 OECD (2019), 5.16. 
32 Statistisches Bundesamt (2020). 
33 Deutsche Bundesbank (2020). 
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tausch), Transport (Mitfahrgelegenheit, Carsharing, Parkplatzsharing), On- 
linearbeitsmärkte für ungelernte und qualifizierte Arbeit (Zustellung und 
Haushaltsdienstleistungen, IT-Berufe, Beratung) sowie (Crowdfunding) und 
Kreditplattformen erfordern völlig andere Messverfahren als im Fall von Güter- 
produktion und Warenhandel, um ökonomische Aktivitäten und Transaktionen 
statistisch sichtbar zu machen. 

Ohne eine fundamentale Anpassung von Statistiken droht der Wirt- 
schaftspolitik zunehmend ein Stochern im Nebel der Unschärfe und Ungenauig- 
keit. Das wird dann dramatisch, wenn die positiven Folgen neuer Technologien 
wie beispielsweise der Digitalisierung — da nicht klar erkennbar — unterschätzt 
und somit Produktivitätsfortschritte viel zu gering ausgewiesen werden, was 
wiederum die Reallohnentwicklung negativ beeinflusst. In Folge dessen wird 
das reale Wirtschaftswachstum unterschätzt, was sich negativ auf Stimmungen 
und Erwartungen und damit auf Konjunkturprognosen auswirkt. 

Wenn unvollständig, inkorrekt und irreführend gemessen wird, werden 
auch Risiken falsch eingeschätzt, Effekte unternehmerischer oder wirtschafts- 
politischer Entscheidungen über- oder unterschätzt und bei der Bewertung von 
Alternativen und deren Vor- und Nachteilen unzutreffende Urteile gefällt. Um 
Messfehler künftig zu verringern und im besten Fall zu verhindern und das We- 
sen einer Wirtschaft der Entdinglichung, Entterritorialisierung und Entstaat- 
lichung abzubilden, sollten Wirtschaft, Politik und Gesellschaft mehr denn je 
Abstand nehmen vom alten BIP-Konzept. Stattdessen bedarf es eines Neuver- 
ständnisses in Ökonomie und Ökonomik und darauf aufbauend einer Neuver- 
messung wirtschaftlicher Aktivitäten und Transaktionen. 
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Das Produktivitatspuzzle — eine kritische Bewertung’ 


Felix Roth 


Einleitung 


Das Wachstum der Arbeitsproduktivität trägt maßgeblich zur Wettbewerbs- 
fahigkeit? und zum steigenden Wohlstand? einer Volkswirtschaft bei. In den 
meisten fortgeschrittenen Volkswirtschaften ist es von zentraler Bedeutung, 
den Lebensstandard einer Gesellschaft mit alternder Bevolkerung aufrechtzu- 
erhalten.* Trotz dieser immensen Bedeutung lässt sich feststellen, dass fortge- 
schrittene Volkswirtschaften wie die USA und die EU seit Beginn der Großen 
Rezession im Jahr 2007 einen deutlichen Rückgang der Wachstumsraten der 
Arbeitsproduktivität verzeichnet haben.’ Nach der Finanzkrise (2008-15/16) hat 
sich jene im Vergleich zur Vorkrisenzeit (1995-2004/07) mehr als halbiert.s 
Obwohl in diesen Volkswirtschaften ab den 1970er-Jahren — mit Ausnah- 
me der USA Mitte bis Ende der 1990er-Jahre - ein stetiger Rückgang des Arbeits- 
produktivitatswachstums zu beobachten ist,” bleibt das Ausmaß eines solchen 


1 Bei dem folgenden Artikel handelt es sich um die deutsche Übersetzung des englischsprachi- 


gen Artikels mit dem Titel The Productivity Puzzle — A Critical Assessment and an Outlook on the 
COVID-19-Crisis (Roth 2021). Dieser basiert auf dem Manuskript des Habilitationsvortrags The Produc- 
tivity Puzzle —A Critical Assessment, welcher vom Autor am 29. Juni 2020 an der Universität Hamburg 
gehalten wurde (Roth 2020a). Der Autor möchte sich bei Thomas Straubhaar und Henning Vöpel für 
ihre konstruktiven Kommentare im Rahmen des gemeinsamen digitalen Workshops Datenwirt- 
schaft: Was ist neu und anders am 11. November 2020 bedanken. 

2 Vgl. Krugman (1994). 

3 Vgl. Heil (2018). 

4 Vgl. Posen/Zettelmeyer (2019). 

° Vgl. Oulton (2018), Van Ark/ O’Mahony (2016), Van Ark (2016), Van Ark / Jager (2017), Van Ark et al. 
(2018). 

6 Vgl. Remes et al. (2018), Brynjolfsson et al. (2019), Van Ark et al. (2018). 

7 Vgl. Gordon (2018), Bergeaud et al. (2016), Brynjolfsson et al. (2019). 
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Rückgangs seit Beginn der Großen Rezession (2008-2013/16) für die im The- 
mengebiet forschenden Wissenschaftler® aus zwei Gründen rätselhaft. 

Zum einen sorgt jener Rückgang für Irritation innerhalb der Forschung, da 
die Realzinsen nahe oder unter null lagen.? Zum anderen ist der Rückgang rät- 
selhaft, da er sich inmitten einer anhaltenden Revolution in der Informations- 
und Kommunikationstechnologie (IKT) sowie der künstlichen Intelligenz (KI) 
vollzog.!° Wirtschaftswissenschaftler haben versucht, dieses Rätsel unter ver- 
schiedenen facettenreichen Bezeichnungen zu erfassen, so etwa als The Secular 
Stagnation Puzzle", The Modern Productivity Paradox? oder einfach als The Produc- 
tivity Puzzle}. 

Der folgende Beitrag beginnt mit einem Überblick über ein von Roth und 
Thum im Jahr 2013 entwickeltes Modell für das Wachstum der Arbeitsproduk- 
tivität, welches um immaterielles Kapital erweitert worden ist.!* Im Anschluss 
daran werden die Trends beim Wachstum der Arbeitsproduktivität von 1950 
bis 2006 untersucht. Im dritten Teil wird auf den ausgeprägten Produktivitäts- 
rückgang von 2007 bis 2015 eingegangen. Im vierten Teil wird das „Produktivi- 
tätspuzzle“ kritisch diskutiert, indem die Schlüsselrolle immaterieller Werte, 
bezogen auf das Wachstum der Arbeitsproduktivität, herausgearbeitet wird. 
Sodann befasst sich der Beitrag mit aktuellen Fragen, die sich anlässlich der CO- 
VID-19-Krise ergeben. Zwei Hauptschlussfolgerungen bilden den Abschluss des 
Beitrags. 


Determinanten des Arbeitsproduktivitätswachstums 


Zunächst werden die Determinanten des Arbeitsproduktivitätswachstums mit- 
hilfe der Präsentation einer um immaterielles Kapital erweiterten Modellspezi- 
fikation herausgearbeitet. Letzteres wurde von Roth und Thum im Jahr 2013 im 
Rahmen des INNODRIVE-Projekts!5 (Intangible Capital and Innovations: Drivers 


® Vgl. Oulton (2018), Remes et al. (2018), Van Ark/Jager (2017). 

? Vgl. Teuling/Baldwin (2014), Summers (2015), Haskel/Westlake (2018a). 
10 Vgl. OECD (2015). 

™ Summers (2014, 2015), Teulings/Baldwin (2014). 

2 Brynjolfsson et al. (2019). 

13 Haskel/Westlake (2018). 

14 Roth and Thum (2013). 

15 INNODRIVE (2011), Roth/Thum (2013). 
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of Growth and Location in the EU) entwickelt und findet derzeit Verwendung 
in seinem laufenden GLOBALINTO-Projekt!s (Capturing the value of intangible 
assets in micro data to promote the EU‘s growth and competitiveness).”” 

Die Modellspezifikation folgt einem Ansatz Benhabibs und Spiegels aus 
dem Jahr 1994,18 der als „ländervergleichende Wachstumsbilanzierung“ be- 
zeichnet werden kann. Dieser unterscheidet sich von dem Rahmen der traditi- 
onellen Einzelwachstumsbilanzierung durch zwei Komponenten: Erstens wer- 
den die Ausgangselastizitaten geschatzt und nicht auferlegt, zweitens kann ein 
Teil des Modells entworfen werden, um die internationale Varianz des Wachs- 
tums der Gesamtfaktorproduktivitat (GFP) zu erklaren. Auf dem theoretischen 
Rahmen von Corrado et al. (2009)!9 aufbauend, wird die Modellspezifikation 
Benhabibs und Spiegels (1994)2° um immaterielle Werte erweitert. Ausgangs- 
punkt fur die Schatzung ist sodann eine erweiterte Cobb-Douglas-Produkti- 
onsfunktion. Unter der Annahme konstanter Skalenertrage wird zunachst die 
Cobb-Douglas-Produktionsfunktion in intensiver Form umgeschrieben. Zwei- 
tens werden die Differenzen in den natürlichen Logarithmen genommen und 
der GFP-Term geschätzt. Dies bietet die folgende Grundlage für die ökonomet- 
rischen Ergebnisse, welche an späterer Stelle in diesem Beitrag veranschaulicht 
und diskutiert werden: 


(dmax, t= qit) 
Git 


(Ingit — Ingit-1) = c + gHit + mit + n(1 — Ur; t) + 


p Era Xj it + Ydit + a(Ink;, = Inkit-1) + B(Inrit = Inrit-1) + Uit (1) 


wo das Wachstum der Arbeitsproduktivität (Ing,, - Inq,,) [Bruttowertschöp- 
fung für die nicht-landwirtschaftlichen privatwirtschaftlichen Sektoren, erwei- 
tert durch die Investitionsströme von immateriellem Unternehmenskapital in 
Land iund Zeitraum t] im Wesentlichen in einen GFP-Term und zwei Kapital- 
terme — materielles und immaterielles Kapital — zerlegt werden kann. GFP wird 
durch einen konstanten Term c dargestellt, der den exogenen technologischen 
Fortschritt darstellt. Die Hohe des Humankapitals (H,,) spiegelt die Innovati- 
onsfahigkeit eines Landes im Inland wider. Der Ausdruck His Cnst = ts) steht 
für einen Aufholprozess. Der Term (1-ur,,) berücksichtigt den Konjunktureffekt. 


16 GLOBALINTO (2020). 

7 Vgl. Roth/Thum (2013), Roth (2020c). 
18 Benhabib/Spiegel (1994). 

12 Vgl. Corrado et al. (2009). 

20 Vgl. Benhabib/Spiegel (1994). 
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Der Ausdruck >. Xie ist die Summe von k zusätzlichen wirtschaftspolitisch re- 
levanten Kontrollvariablen, die möglicherweise das GFP-Wachstum erklären 
könnten. Diese schließen öffentliche immaterielle Vermögenswerte ein, zum 
Beispiel formelle und informelle Institutionen wie Rechtsstaatlichkeit und in- 
terpersonelles und systemisches Bevölkerungsvertrauen. Sie sind von zentra- 
ler Bedeutung für das Wachstum. yd,, sind Jahres-Dummyvariablen, die unter 
anderem die wirtschaftlichen Abschwünge in den Jahren 2001 und 2008 be- 
rücksichtigen sollen. Als Nächstes folgen der Term für das Wachstum materiel- 
ler Kapitaldienstleistungen (Ink, -Ink,, ‚) sowie der Term für das Wachstum der 
immateriellen Kapitaldienstleistungen (Inr,-Inr,_,) und der Fehlerterm u, Im 
fünften Teil dieses Beitrags werden wir auf den ß-Koefhizienten für das Wachs- 
tum immaterieller Kapitaldienstleistungen eingehen. 


Wachstum der Arbeitsproduktivität, 1950 bis 2006 


Tabelle 1 aus von Van Ark et al. (2008)?! weist unter anderem die durchschnittli- 
chen jährlichen Wachstumsraten des BIP pro Arbeitsstunde in der EU-15 undden 
USA von 1950 bis 2006 aus. Die visualisierte empirische Evidenz zeigt, dass das 
Wachstum der Arbeitsproduktivität in der EU von 1950 bis 1973 mit 5,3 % doppelt 
so hoch war wiein den USA mit 2,5 %. Das gleiche Muster - wenn auch mit nied- 
rigeren Zahlen - gilt für den Zeitraum 1973 bis 1995 mit Werten von 2,4 % für 
die EU-15 und 1,2 % für die USA. Die Forschung führt diesen Anstieg des Arbeits- 
produktivitätswachstums innerhalb der EU gegenüber den USA eindeutig auf 
einen Aufholprozess zurück. Dieser baut auf einer starken Kompetenzbasis auf, 
die in der Sekundarstufe II vermittelt wird, und auf einem Produktionsprozess, 
der auf Nachahmung basiert. Interessanterweise ändert sich das Muster bei der 
Analyse des Zeitraums 1995 bis 2006. Das Wachstum der Arbeitsproduktivität 
innerhalb den USA stieg auf 2,3 % gegenüber 1,5 % innerhalb der EU-15. 

Bei der Analyse der zugrunde liegenden Beiträge zum Wachstum der Ar- 
beitsproduktivität in Tabelle 4 ihres Artikels stellen Van Ark et al. fest, dass die- 
ser Rückgang des Arbeitsproduktivitätswachstums innerhalb der EU größten- 
teils auf eine geringer ausgeprägte wissensbasierte Wirtschaft zurückzuführen 
ist.2? Eine weitere sektorale Zerlegung durch die Autoren zeigt einen deutlichen 
Rückgang des GFP-Wachstums in den privatwirtschaftlich organisierten Sek- 


21 Van Ark et al. (2008). 
22 Vgl. Van Ark et al. (2008). 
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toren der EU-15 gegenüber den USA, insbesondere bei den privatwirtschaftlich 
organisierten Dienstleistungen. Die Autoren führen die Produktivitätslücke bei 
diesen EU-Dienstleistungen auf Mängel bei die IKT ergänzenden Investitionen 
in immaterielles Kapital sowie auf Rigiditäten im EU-Binnenmarkt in Bezug auf 
Produkt-, Arbeits- und Dienstleistungsmärkte zurück. 

Ähnliche Ergebnisse, die im Einklang mit diesem Gesamtargument stehen, 
werden von einer Gruppe von Ökonomen vorgelegt, die mit Sapir und Aghion 
zusammenarbeiten. Die Gruppe betont die Bedeutung öffentlicher immateriel- 
ler Vermögenswerte, nämlich die Quantität und Qualität der Hochschulbildung, 
um die Lücke im Wachstum der Arbeitsproduktivität zu erklaren.?3 In diesem 
Zusammenhang kommen Brynjolfsson et al. zu dem Schluss, dass die Produkti- 
vitätslücke am besten mit dem Faktum niedrigerer Investitionen in IKT und KI 
und verzögerten komplementären immateriellen Kapitalinvestitionen erklärt 
werden konne.”4 


Das Produktivitätspuzzle, 2007 bis 2015 


Dies führt zu einer Betrachtung des Zeitraums seit Beginn der Großen Rezession 
von 2007 bis 2015. Tabelle 1 in Van Ark et al. zeigt einen deutlichen Rückgang 
des Wachstums der Arbeitsproduktivität seit Beginn der Großen Rezession im 
Jahr 2008.25 Die Wachstumsraten der Arbeitsproduktivität gingen im Euroraum 
von 14% auf 0,6% und in den USA von 2,5% auf 1,3 %, das heißt jeweils um 
die Hälfte zurück. Wie Oulton (2018)? hervorhebt, sei ein Rückgang dieser Grö- 
ßenordnung außergewöhnlich und nicht nur eine Fortsetzung der historischen 
Trends der Vergangenheit, wie von den US-Wirtschaftshistorikern Gordon?’ 
und Cowen?® behauptet. Aber was hat diesen starken Rückgang des Arbeitspro- 
duktivitätswachstums ausgelöst? 

Zwei Wirkungskanäle lassen sich als Erklärung identifizieren: Erstens 
wurde der Rückgang des Arbeitsproduktivitätswachstums mit einem deutli- 
chen Rückgang des Wachstums der Gesamtfaktorproduktivität in Verbindung 


23 Vgl. Aghion (2008), Aghion/Howitt (2006), Aghion et al. (2007, 2008, 2010), Sapir et al. (2004). 
24 Vgl. Brynjolfsson et al. (2019). 

25 Vgl. Van Ark et al. (2018). 

26 Vgl. Oulton (2018). 

27 Vgl. Gordon (2018). 

28 Vgl. Cowen (2011). 
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gebracht. Die von Bergeaud et al. veranschaulichten Langzeitbefunde mit Zeit- 
reihenbefunden zu Arbeitsproduktivitatswachstum und Gesamtfaktorproduk- 
tivitat von 1890 bis 2010 stützen eine solche Behauptung.?9 

Zweitens ist der Rückgang des Arbeitsproduktivitätswachstums auf ei- 
nen Rückgang der Investitionen zurückzuführen. Diese Behauptungen werden 
durch Analysen gestützt, welche eine erhebliche Rückläufigkeit von Investitio- 
nen in Sachkapital im Zeitraum 2008 bis 2013 aufzeigen. Der Rückgang der ma- 
teriellen Investitionen innerhalb der EU-Volkswirtschaften ist in Abbildung ı 
dargestellt. Jene Visualisierung orientiert sich an der Veröffentlichung von Roth 
aus dem Jahr 2020.3° Insbesondere ist der stärkste Rückgang der materiellen 
Kapitalinvestitionen in denjenigen Peripherieländern des Euroraums beobacht- 
bar, welche intensive Sparmaßnahmen ergriffen haben. 

Dieser Rückgang des Wachstums sowie der Investitionen in die Arbeits- 
produktivität hat viele Wissenschaftler vor ein Rätsel gestellt.?! Erstens ist der 
Rückgang deshalb rätselhaft, weil die Realzinsen in den USA, Japan, UK und 
im Euroraum nahe oder unter null lagen.?? Zweitens ist er deshalb rätselhaft, 
weil er inmitten einer anhaltenden Revolution in den Bereichen IKT und KI 
stattfand.33 Wie Nakamura betont, deutet die Intensität der technologischen 
Innovationen seit Anfang der 1990-er Jahre auf eine „dramatisch dynamische 
Wirtschaft!“ hin.3* Wie aus Abbildung 5.4 in Haskel und Westlake hervorgeht, 
haben die Top-100- und Top-5 %-Frontier-Unternehmen im Gegensatz zu den 
Nicht-Frontier-Unternehmen seit dem Jahr 2000 tatsächlich einen enormen 
Anstieg des Arbeitsproduktivitätswachstums verzeichnet.” Darüber hinaus 
weist die vorhandene empirische Evidenz auf die zunehmende Bedeutung im- 
materieller Vermögenswerte bei den S&P-500-Unternehmen hin und ermöglicht 
die Feststellung, dass die zehn größten US-Unternehmen fast ausschließlich auf 
immateriellen Vermögenswerten basieren.’ Eine solch aussagekräftige empiri- 
sche Evidenz stützt Nakamuras Behauptung aus dem Jahre 2019?” nachhaltig. 


29 Vgl. Bergeaud et al. (2016). 

30 Vgl. Roth (2020b). 

31 Vgl. Oulton (2018), Remes et al. (2018), Van Ark/Jager (2017). 

Vgl. Teuling/Baldwin (2014), Summers (2015), Haskel/Westlake (2018a). 
Vgl. OECD (2015). 

Vgl. Nakamura (2019). 

Vgl. Haskel/Westlake (2018a), S. 95). 

Vgl. Ross (2020). 

Vgl. Nakamura (2019). 
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Anmerkung: Die Investitionen in immaterielles und materielles Kapital sowie die Arbeitsproduktivität sind in Millio- 
nen Landeswährungen angegeben und im Jahr 2008 auf 1 normiert. Die durchgezogene Linie zeigt den Beginn der 
Finanzkrise im September 2008 an. Die gestrichelte Linie zeigt den Beginn der wirtschaftlichen Erholung Ende 2013 
an. Für Griechenland (Greece), Irland (Ireland) , Slovenien (Slovenia) und die Slowakei (Slovakia) werden angepasste 
y-Skalenwerte verwendet. Der EU-16 Durchschnitt basiert auf KKP-bereinigten Werten. 


Investitionen in immaterielles und materielles Kapital und Arbeitsproduktivitätswachstum, 


EU-16, 2000 bis 2015 
Quelle: Abbildung 4 in Roth (2020b), S. 680. 
Quelle(n): INTAN-Invest (NACE2) Daten Corrado et al. (2018). 
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Wissenschaftler wie Summers identifizieren einen Mangel an Gesamt- 
nachfrage als Hauptursache des Rückgangs des Wachstums und der Investi- 
tionen in die Arbeitsproduktivitat.38 Die Anwendung ihrer Empfehlungen zur 
Stimulierung der Gesamtnachfrage innerhalb des Euroraums impliziert zwei 
Strategiestrange: Erstens verpflichtete sich die Europaische Zentralbank dazu, 
ein Programm zur quantitativen Lockerung (QE) durchzuführen. Zweitens hat 
sich die Europäische Kommission darauf festgelegt, einen EU-weiten Europä- 
ischen Investitionsplan auf den Weg zu bringen.?? Dies knüpfte sie an die Be- 
dingung, dass auf der Ebene der Mitgliedstaaten eine Strukturreformagenda 
verabschiedet wird, um die Grundlage für wachstumsfördernde Maßnahmen 
zu schaffen. Ein von einigen prominenten Ökonomen wie De Grauwe?° und 
Fratzscher*! favorisiertes Konjunkturpaket für Kernwirtschaften wie Deutsch- 
land wurde jedoch nie auf den Weg gebracht. 

Dennoch war es der Politik auf EU-Ebene bereits gelungen, die Unterstüt- 
zung der Nachfrage anzuregen. Wie in Abbildung dargestellt, hat sie damit seit 
2014 eine wirtschaftliche Erholung eingeleitet und die Investitionen im Euro- 
raum angeregt. Die Unterstützung der Gesamtnachfrage anzuregen ist jedoch 
nur der erste Schritt zu einer Lösung des Produktivitätspuzzles. Ein weiterer we- 
sentlicher Schritt ist der Einbezug immaterieller Kapitalanlagen in die Vermö- 
gensgrenze der Volkswirtschaftlichen Gesamtrechnungen. 


Immaterielles Kapital und das Produktivitätspuzzle 


Aber welche Investitionen in immaterielles Kapital sollten in die Vermögensgren- 
ze der Volkswirtschaftlichen Gesamtrechnungen einbezogen werden? Corrado, 
Hulten und Sichel (CHS) kategorisieren in ihrem 2005 veröffentlichten wegwei- 
senden Buchkapitel drei Dimensionen immaterieller Vermögenswerte. Diese 
werden in Tabelle 1 dargestellt. 

Zunächst führen CHS computerisierte Informationen an, welche sie als 
„knowledge embedded in computer programs and computerized databases“ 
(S. 23) definieren. Als weitere Dimension nennen sie innovationsbezogenes Wis- 


w 


8 Vgl. Draghi (2014), Krugman (2014), Summers (2014, 2015). 
° Vgl. Fichtner et al. (2014). 

° Vgl. De Grauwe (2015). 

1 Vgl. Fratzscher (2014). 

? Vgl. Corrado et al. (2005). 
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sen, das sie als ,not only the scienfific knowledge embedded in patents, licenses 
and general know-how (not patented) but also the innovative and artistic cont- 
ent in commercial copyrights, licenses and designs“ (S.26) verstehen. Die dritte 
Komponente bilden Unternehmenskompetenzen, die sie als „the value of brand 
names and other knowledge embedded in firm-specific human and structural re- 
sources‘ (S. 28) definieren. 


Tab. 1: Überblick über die Definitionen der immateriellen Vermögenswerte von Unternehmen im Rah- 
men von CHS (2005) 


CATEGORY OF 


IRTÄNGIBIE ASSETS DEFINITION BY CHS (2005) BUSINESS INTANGIBLE ITEM INCLUDED IN NA 
Computerized information | “knowledge embedded in com- |Computer software Yes 
puter programs and computeri- | Computerised database Yes 
zed databases” (p.23) 
Innovative property “not only the scientific knowled- | Science and engineering R&D | Yes 
ge embedded in patents, licenses | Mineral exploration Yes 


d | know-h t 
and general KNOW HGW ine Copyright and license costs Yes 


patented) but also the innovative 
and artistic content in com- Other product development, | No 


mercial copyrights, licenses and design and research expenses | (new intangible 
designs” (p.26) 

Economic competencies “the value of brand names and __| Brand equity No 
other knowledge embedded in (new intangible 

firm-specific human and structu- | Firm-specific human capital | No 
ral resources” (P.28) (new intangible 

Organizational structure No 
(new intangible 


Anmerkung: NA = National Account. 
Quelle: Eigene Adaption von CSH (2005). Tabelle | in Roth (2019), 5. 6. 


Inwieweit sind diese Vermögenswerte für die Stimulierung des Arbeitspro- 
duktivitätswachstums relevant? Zwei Beispiele sind zu nennen, welche sich aus 
einer Kette von Argumenten ableiten, wie sie von Brynjolfsson et al.4? in den letz- 
ten zweiJahrzehnten entwickelt worden sind. Brynjolfsson und sein Team stellen 
fest, dass ein Unternehmen für jeden in Software investierten Euro zusätzliche 10 
Euro für die Entwicklung von Unternehmenskompetenzen ausgeben muss, um 
das volle Potenzial des Wachstums der Arbeitsproduktivität auszuschöpfen. Diese 
zusätzlichen Investitionen umfassen die Umschulung des Personals zur Nutzung 
der Software sowie die Umstrukturierung der organisatorischen Abläufe. Ähnli- 
che Ergebnisse wurden für Investitionen in KI festgestellt. 


“3 Vgl. Brynjolfsson et al. (2000, 2002). 
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Welche Auswirkungen sind nun zu erwarten, wenn diese immateriellen 
Vermögenswerte in die Vermögensgrenze der Volkswirtschaftlichen Gesamt- 
rechnungen einbezogen werden? Tabelle 2 aus der Arbeit von Roth aus dem Jahr 
2020“ fasst drei Hauptergebnisse zusammen. 


Tab. 2: Überblick über bestehende empirische Studien, 2009 bis 2018 


AUTHORS COUNTRY INVESTMENT CONTRIBUTION GROWTH ACCELE- ARTICLE HARMONIZED METHODO- 
(IN GDP) IN % TO LPG IN %t RATION IN % CROSS-COUN- LOGY 
TRY DATASET 
Corrado et al. nage "27 "1.2 
US u 7 i RolW GA 

(2009) 03 (95-03) (95-03) 
Fukao et al. "111 "27,16 173, -1.4 

JAP i à »  RolW GA 
(2009) (00-05) (95-00); (00-05) (95-00), (00-05) 
Marrano et al. "13** "20 "13.1 

UK u " " RolW GA 
(2009) 04, (95-03) (95-03) 
Nakamura US Intangible=Tangible / / RolW GA 
(2010) (00-07) 
Edquist (2011) SE Or "41; 24 16,23 RolW GA 

04)" (95-00); (00-06)" (95-00), (00-06)" 

Roth and "ggr "so "4.4 

EU-1 i i K RolW INNODRIVE CCGA 
Thum (2013) À (98-05) (98-05) (98-05) 
Corrado et al. "6.6 "24 "INTAN-Invest 

EU-1 ii m OREP 7 GA 
(2013) 5 (95-09) (95-07) / (NACE1) 
Corrado etal. EU-14, "7.2, 6.4 "30, 10; 19, 8; 43#,17 / JIPD "INTAN-Invest GA 
(2018) NMS-4 (00-13)" (00-13) (00-07); (07-13)" (NACE2)" 


Anmerkungen: tLPG=Labour Productivity Growth (Arbeitsproduktivitätswachstum). “Das Maß hier ist die nicht-land- 
wirtschaftliche-Unternehmensleistung. **Das Maß hier ist die bereinigte Bruttowertschöpfung (BWS) des Marktsek- 
tors. “Das Maß hier ist die BWS. ****Das Maß ist die BWS (ausgenommen k7o). #Capital share (Kapitalanteil). US = 
United States (Vereinigte Staaten), UK = United Kingdom (Vereinigtes Königreich), JIPD = Journal of Infrastructure, Po- 
licy and Development, GA = Growth Accounting (Wachstumsbilanzierung), CCGA = Cross Country Growth Accounting 
(ländervergleichende Wachstumsbilanzierung). Die Zahlen in Klammern beziehen sich auf die jeweiligen Zeiträume. 
Quelle: Tabelle | in Roth (2020b), 5. 675. 


Erstens steigen die Gesamtinvestitionen im Verhältnis zum BIP erheblich an. Die 
Investitionen in immaterielle Vermögenswerte nähern sich dem Niveau an, das 
für solche in materielles Kapital gilt, sobald immaterielle Vermögenswerte in 
die Vermögensgrenze der Volkswirtschaftlichen Gesamtrechnung einbezogen 
werden. Zweitens leisten immaterielle Vermögenswerte einen wesentlichen 
Beitrag zum Wachstum der Arbeitsproduktivität. So zeigt beispielsweise die Ar- 
beit von Roth und Thum aus dem Jahr 2013, dass das Wachstum der immateri- 
ellen Kapitaldienstleistungen 50 % der internationalen Unterschiede in Bezug 
auf das Wachstum der Arbeitsproduktivität in der EU erklären kann.“ Imma- 


44 Vgl. Roth (2020b). 
45 Vgl. Roth and Thum (2013). 
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terielle Kapitaldienstleistungen stellen hierbei den dominierenden Faktor dar. 
Drittens beschleunigt sich das Wachstum der Arbeitsproduktivität. So berichtet 
etwa Edquist berichtet etwa, dass sich das Wachstum der Arbeitsproduktivität 
in Schweden um 16 % beschleunigte, nachdem immaterielle Vermögenswerte 
berücksichtigt worden waren.“ 

Welche Auswirkungen haben diese Ergebnisse auf das Produktivitätspuzz- 
le? Als Antwort auf diese Frage können vier Punkte herausgearbeitet werden: 
Erstens ist der „rätselhafte“ Rückgang der Investitionen größtenteils auf eine 
fehlerhafte Messung der tatsächlichen Investitionsraten der Unternehmen in 
den meisten fortgeschrittenen Volkswirtschaften zurückzuführen. Die zeitge- 
nössischen Klassifikationen der Volkswirtschaftlichen Gesamtrechnung wur- 
den noch nicht vollständig überarbeitet, um dem anhaltenden Übergang zur 
wissensbasierten Wirtschaft des 21. Jahrhunderts Rechnung zu tragen. Obwohl 
bereits selektive Elemente immaterieller Vermögenswerte wie Software und 
wissenschaftliche Forschung und Entwicklung berücksichtigt wurden, sind 
Investitionen in Unternehmenskompetenzen wie firmenspezifisches Human- 
und Organisationskapital weiterhin ausgeschlossen. 

Abbildung 2 aus der Arbeit von Roth aus dem Jahr 2020 zeigt, dass die 
Gesamtinvestitionen in eine EU-16-Länderstichprobe nach Aufnahme der im- 
materiellen Vermögenswerte in die Volkswirtschaftliche Gesamtrechnung fast 
doppelt so hoch sind und 25 % der Gesamtsumme ausmachen. Darüber hinaus 
ist es interessant zu beobachten, dass in sieben von 16 Ländern die Unterneh- 
mensinvestitionen in immaterielles Kapital bereits höher sind als in materielles 
Kapital. 

Abbildung 1 aus der Arbeit von Roth im Jahr 2020 zeigt, dass sich die Inves- 
titionen in immaterielles Kapital trotz eines stetigen Ruckgangs der Sachanla- 
gen, insbesondere nach der Finanzkrise, rasch erholt haben und einen stetigen 
Aufwärtstrend verzeichnen.“ Diese Ergebnisse decken sich mit den neuesten 
Erkenntnissen aus demim Anschluss an dem INNODRIVE-Datensatz entwickel- 
ten INTAN-Invest-Datensatzes, welcher in einem Redemanuskript von Haskel 
aus dem Jahr 202049 verwendet wird. Es werden ein stetiger Rückgang des ma- 
teriellen Kapitals und ein stetiger Anstieg des immateriellen Kapitals über die 
Finanzkrise hinaus gezeigt. 


46 Vgl. Edquist (2011). 
7 vgl. Roth (20200), 5.680. 
8 Vgl. Roth (2020b), S. 680. 
? Vgl. Haskel (2020). 
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Anmerkungen: CT=communications technology (Kommunikationstechnik); IT=information technolo- 
gy (Informationstechnologie); OCon=total non-residential capital investment (Gesamtinvestitionen in Ge- 
werbeimmobillien), OMach=other machinery and equipment (Andere Maschinen und Ausrüstungen); TraE- 
Q=transport equipment (Transportausrüstung); Cult=cultivated assets (Vermögenswerte für Nutztiere und 
Nutzpflanzungen); IC=intangible capital (immaterielles Kapital). Wohngebäude wurden ausgeklammert. 
Die Werte über den Balken stellen das Verhältnis von immateriellen zu materiellen Investitionen dar. 

Quelle(n): INTAN-Invest (NACE2) Daten Corrado et al. (2018) und EUKLEMS Daten Jäger (2017). 


Abb.2: Materielle und immaterielle Unternehmensinvestitionen (in Prozentpunkten der Bruttowert- 
schöpfung), EU-16, 2000 bis 2015 
Quelle: Abbildung 3 in Roth (20206), 5. 680. 


Die obigen Belege zeigen, dass die Verwendung materieller Investitionsströmen 
als alleinige Grundlage der Analyse zu fehlerhaften empirischen Untersuchun- 
gen und letztendlich zur Implementierung fehlgeleiteter politischer Maßnah- 
men führt. 

Zweitens bewirkt der Einbezug immaterieller Vermögenswerte in die Ver- 
mögensgrenze der Volkswirtschaftlichen Gesamtrechnungen auch eine Steige- 
rung des Arbeitsproduktivitätswachstums. Dies hat Edquist bereits für Schwe- 
den gezeigt.’ Seine Ergebnisse stehen hier im Gegensatz zu Behauptungen von 


5° vgl. Edquist (2011). 
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Haskel und Westlake"? und Syverson??. Die Ergebnisse von Roth aus dem Jahr 
2020 aus dem GLOBALINTO-Projekt®? stützen die Ergebnisse von Edquist°*. Die 
Analyse von Zeiten der wirtschaftlichen Erholung zeigt, dass sich das Wachs- 
tum der Arbeitsproduktivität um 0,4 Prozentpunkte (oder 22%) von 1,8% auf 
2,2% beschleunigt hat. In diesem Zusammenhang prognostiziert Nakamura 
sogar, dass die Fehlmessung des Arbeitsproduktivitätswachstums höchstwahr- 
scheinlich eine jährliche Wachstumsrate von 2 % ergeben werde.55 

Drittens haben mehrere herausragende Beiträge den Zusammenhang zwi- 
schen der Höhe der Unternehmensinvestitionen in immaterielle Vermögens- 
werte und den Veränderungen der GFP hervorgehoben. Van Ark und O‘Mahony, 
Van Ark und Jager sowie Bounfour und Miyagawa führen den Rückgang der 
Arbeitsproduktivitat und des GFP-Wachstums hauptsachlich auf eine langsa- 
mere Verbreitung von Technologie und Innovation zurück, die wiederum aus 
niedrigen Wachstumsraten der Investitionen in IKT und komplementare imma- 
terielle Werte resultiert.5° Haskel und Westlake heben auch eine Verringerung 
der Spillover-Effekte immaterieller Vermogenswerte auf GFP hervor, da sich die 
Kluft zwischen führenden und nacheilenden Unternehmen vergrößert.5’ Darü- 
ber hinaus haben Brynjolfsson et al. argumentiert, dass mehr Investitionen in 
komplementäre immaterielle Vermögenswerte erforderlich sind, um den vol- 
len Nutzen der KI für das Wachstum der Arbeitsproduktivität ausschöpfen zu 
können.°® 


51 vg p 
52 Vg i 
53 Vg i 
54 Vg f 
55 Vg $ 
56 Vg ; 
57 Vg L 
58 vg } 


Haskel/Westlake (2018a). 

Syverson (2017). 

Roth (2020b). 

Edquist (2011). 

Nakamura (2019). 

Bounfour/Miyagawa (2015), Van Ark (2016), Van Ark / O’Mahony (2016), Van Ark / Jäger (2017). 
Haskel/Westlake (2018b). 

Brynjolfsson et al. (2019). 
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Tab. 3: Immaterielles Kapital und Arbeitsproduktivitätswachstum, EU-16, 2000-15, PP-PCSE Schätzung 


Estimation method PP-PCSE PP-PCSE PP-PCSE PP-PCSE PP-PCSE 2SLS 
Time sample 2000-2015 2000-2015 2000-2015 2008-2015 2000-2015 2000-2015 
Equation (1) (2) (3) (4) (5) (6) 

A : 0.31** 0.19** 0.28*** -0.13 0.18** 0.58 
Tangible services growth (0.08) (0.08) (0.08) (0:5) (0.07) (0.42) 
Tangible services growth*crisis - - ee - - - 

; f y E £ : 0.47 7 7 
Tangible services growth*recovery (0.30) 

r ; _ 0.38*** 0.48*** 632" e 0.50°** 
Intangible services growth (0.07) (0.09) (on) (016) 
Intangible services growth*crisis - - a - - 

Intangible services growth*recovery - - - ae - 
Innovative property services growth - - - = ozr" 
(0.07) 
Computerized information services _ _ R _ -0.01 
growth (0.04 
Economic Competencies services _ 7 P _ 0.02 7 
growth (0.06 
; 0.07*** 0.05*** 0.05*** 0.02 0.06*** 0.07*** 
Upper secongaryeducatidn ig (0.02) (0.01) (0.01) (0.02) (0.01 (0.02) 
Catchy -0.02** ~0.02"*" -0.02*** -0.01 -0.02** -0.02* 
P (0.01) (0.01) (0.01) (0.01) (0.01 (0.01) 
Biicinacecvele -0.11* -0.12* -0.13** -0.13* -0.12* -0.11°* 
y (0.06) (0.06) (0.06) (0.07) (0.06 (0.05) 
R-squared 0,40 0.50 0.54 0.63 0.54 0.46 
Observations 256 256 256 128 256 208 
Number of countries 16 16 16 16 16 16 


Anmerkungen: In Regression (1) schließen das Wachstum der materiellen Dienstleistungen, das Wachstum der 
Arbeitsproduktivität und der Aufholprozess Software, F&E sowie Unterhaltung, künstlerische und literarische 
Originale und Mineralienexploration aus. In den Regressionen (2-6) werden das Wachstum der Arbeitsproduk- 
tivität und der Aufholprozess mit immateriellem Kapital erweitert. Materielles Kapital schließt Wohngebäu- 
de aus. Das Wachstum der Arbeitsproduktivität wurde auf der Grundlage der BWS der nicht-landwirtschaft- 
lichen privatwirtschaftlichen Sektoren (ohne Immobilienaktivitäten) berechnet. ***p<o.o1 , **p<0.05 , *p<0.1. 
Quelle: Tabelle Il in Roth (2020b), 5. 682. 


Viertens weisen die ökonometrischen Ergebnisse, wie aus Tabelle 3 aus der Ar- 
beit von Roth aus dem Jahr 2020°° hervorgeht, auf die Bedeutung des Wachs- 
tums der immateriellen Kapitaldienstleistungen für das Wachstum der Ar- 
beitsproduktivität auf der Makroebene hin. Roth verwendet einen Ansatz der 


59 Vgl. Roth (2020b). 
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„ländervergleichenden Wachstumsbilanzierung“ für eine EU-16-Länderstich- 
probe im Zeitraum 2000 bis 2015. Sie basiert auf der um immaterielles Kapital 
erweiterten Modellspezifikation, wie sie zu Beginn dieses Beitrages vorgestellt 
wurde. Es zeigt sich, dass das Wachstum bei immateriellen Kapitaldienstleis- 
tungen den größten Teil des Wachstums der Arbeitsproduktivität erklären kann 
— bis zu 66 % beziehungsweise 46 %. Dies wird durch die Größe des Beta-Koef- 
fizienten von 0,38 beziehungsweise 0,26 gezeigt. Ebenso signifikante, aber we- 
niger ausgeprägte Ergebnisse finden sich auf der Meso- und der Mikroebene.®° 


Schlussfolgerungen 


Der Beitrag führt zu dem Schluss, dass ein großer Teil des Produktivitätsrätsels 
gelöst werden kann, indem immaterielles Kapital in die Vermögensgrenze der 
Volkswirtschaftlichen Gesamtrechnungen einbezogen wird. Beim Produktivi- 
tätspuzzle handelt es sich also großenteils um einen Strukturwandel — von der 
Industrie- hin zur Wissensökonomik. 


Exkurs: COVID-19-Krise und Arbeitsproduktivitätswachstum — 
ein Ausblick 


Wie wird sich die gegenwartige COVID-19-Krise auf das Wachstum der Arbeits- 
produktivitat auswirken? Um diese Frage zu beantworten, sollten wir eine kurz- 
fristige von der mittel- bis langfristigen Perspektive unterscheiden. 

Um die kurzfristigen Auswirkungen zu verstehen, ist es hilfreich, das Mus- 
ter zu verstehen, das sich nach der Finanzkrise von 2008 abgezeichnet hat. In 
Abbildung 1.6 ihrer Publikation aus dem Jahr 2012 zeigt Mas die empirische Evi- 
denz des Arbeitsproduktivitatswachstums für die EU und die USA für die Jah- 
re 2007 bis 2010. Die Verfasserin verdeutlicht, dass die USA von 2007 bis 2010 
einen tatsächlichen Anstieg des Arbeitsproduktivitätswachstums von 1,93 % 
auf 2,02 % verzeichneten, während für die EU-15 ein deutlicher Rückgang des 
Arbeitsproduktivitatswachstums von 1,41 % auf 0,07 % festzustellen war. Dieser 
Unterschied wird von Mas auf die je verschiedenen Arbeitsmarktregelungen in 


6° Vgl. Niebel et al. (2017), Marrocu et al. (2011) 
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den beiden Volkswirtschaften zuruckgefuhrt.*! Während die Wohlfahrtsstaaten 
der EU Kurzarbeitsprogramme intensiv genutzt haben, um die Gefahr großer 
Entlassungen nach der Finanzkrise einzudammen, haben die USA von einer sol- 
chen Politik abgesehen. 

Wie aus den Daten der Prognosen der Generaldirektion Wirtschaft und 
Finanzen (GDWE) der Europäischen Kommission vom Frühjahr 2020 hervor- 
geht, wird das Wachstum der Arbeitsproduktivität im Euroraum im Jahr 2020 
um 3,2 Prozentpunkte zurückgehen, wobei in Deutschland ein Höchstwert von 
5,6 Prozentpunkten erreicht werden wird.6? Umgekehrt wird der Rückgang des 
Wachstums der US-Arbeitsproduktivität geringfügig sein und auf nur 0,2 Pro- 
zentpunkte geschätzt. Ähnlich wie nach der Finanzkrise im Jahr 2009 werden 
die Kurzarbeitsprogramme zur Dämpfung der Gefahr großer Entlassungen zu 
einem deutlichen Rückgang des Wachstums der Arbeitsproduktivität im Euro- 
raum und in Deutschland gegenüber den USA führen. Aber wie groß ist die Aus- 
wirkung von COVID-19 aus historischer Sicht? 

Eine aktuelle empirische Zeitreihenevidenz von Bergeaud et al. über den 
Zeitraum 1875 bis 2025 zeigt, dass die Auswirkungen auf das BIP-Wachstum 
zwar stärker sind als die der Finanzkrise im Jahr 2008, jedoch nur einen Bruch- 
teil des Rückgangs ausmachen, der während der Weltwirtschaftskrise im Jahr 
1929 zu verzeichnen war.6 Darüber hinaus wird es im Jahr 2021 eine rasche Er- 
holung und eine Rückkehr zum vorherigen Niveau von 2019 geben. Ein ähnli- 
cher Rückgang der Investitionen im Jahr 2020 aufgrund der COVID-19-Krise mit 
einer starken Erholung im Jahr 2021 wird von der Generaldirektion Wirtschaft 
und Finanzen der Europäischen Kommission prognostiziert.6* Ob diese auch für 
immaterielle Kapitalinvestitionen gilt, bleibt offen. Im Rahmen des GLOBALIN- 


61 Vgl. Mas (2012). 


62 Vgl. European Commission (2020a). Die GDWF benutzt Daten von Eurostat und berechnet das 
Wachstum der Arbeitsproduktivität im Jahr 2020 als gesamtjährliche prozentuale Veränderung des 
realen Bruttoinlandsprodukts pro Beschäftigten in Bezug auf das Gesamtjahr 2019. Im Gegensatz 
hierzu beruhen die Berechnungen von Schneider (2021) in diesem Sammelband auf Daten von Sta- 
tista und auf der prozentualen Veränderung der Werte im zweiten Quartal 2020 in Bezug auf die 
Werte im vierten Quartal 2019 des realen Bruttoinlandsprodukts pro Gesamtheit der geleisteten 
Arbeitsstunden. Diese Unterschiede in Bezug auf Methodologie und Datenquelle führen zu den di- 
vergierenden Berechnungen des Arbeitsproduktivitätswachstums für das Fallbeispiel Deutschlands 
zu Zeiten der COVID-19-Krise. 


63 Vgl. Bergeaud et al. (2020). 
64 Vgl. European Commission (2020a). 
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TO-Projekts® hoffen die beteiligten Projektpartner, diese Frage mit einer pass- 
genauen COVID-19-Umfrage zu immateriellen Kapitalinvestitionen — welche 
unter Zuhilfenahme einer reprasentativen Unternehmensstichprobe in sieben 
EU-Landern durchgeführt wird — beantworten zu können. 

Um die mittel- und langfristigen Auswirkungen zu verstehen, ist es hilf- 
reich die politischen Maßnahmen, die zur Bewältigung der COVID-19-Krise er- 
griffen wurden, zu analysieren. Als Reaktion auf die Pandemie wurden auf der 
Ebene der Mitgliedstaaten unter den ausgewählten Kernländern des Euroraums 
historisch große Konjunkturpakete von bis zu 200 Mrd. Euro beschlossen.s6 Auf 
Bundesebene der EU beträgt die vereinbarte Haushaltskapazität insgesamt 750 
Mrd. Euro. Diese Finanzpolitik wird vom Pandemie-Notfallkaufprogramm 
(PEPP) der EZB mit einem Gesamtvolumen von 1.350 Mrd. Euro flankiert. Die 
Neuartigkeit des PEPP ist die Rolle, die die EZB als Kreditgeberin der letzten 
Instanz auf dem Markt für Staatsanleihen ohne Beschränkungen für Käufe in 
einzelnen Ländern übernimmt.s® Ebenso historisch ist es für die Europäische 
Kommission, in ihrer Eigenschaft als multinationale Akteurin innerhalb ihres 
mehrjährigen Finanzrahmens 750 Mrd. Euro aufzunehmen. Dies ist höchst- 
wahrscheinlich ein bedeutender Schritt, um eine stärkere Fiskalunion zu schaf- 
fen. Wie in einer Arbeit von Roth aus dem Jahr 2020 dargelegt, genießen die 
Präsidenten der EZB und der Europäischen Kommission angesichts der großen 
öffentlichen Unterstützung des Euro in den ersten zwei Jahrzehnten (1999 bis 
2019) höchstwahrscheinlich die notwendige politische Legitimität, um diese 
entscheidenden Maßnahmen zu ergreifen. 

Werden diese Investitionspläne jedoch dazu beitragen, eine Erholung des 
Euroraums zu fördern? Aus obigen Argumenten lässt sich ableiten, dass diese 
Impulse dem Euroraum sicherlich helfen, sich kurzfristig zu erholen, insbeson- 
dere da es sich dieses Mal um ein dreifaches Impulsprogramm handelt: fiskali- 
sche Impulse auf der Ebene der Mitgliedstaaten und der EU, gepaart mit mone- 
taren Impulsen vonseiten der EZB. 

Mittel- bis langfristig sind zwei Aspekte für die Erholung des Arbeits- 
produktivitätswachstums relevant. Erstens muss der derzeitige Digitalisie- 


65 GLOBALINTO (2020). 

66 Vgl. Greive (2020) 

67 Vgl. European Commission (2020b). 
8 Vgl. Schnabel (2020) 

® Vgl. Roth (2020c). 
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rungsschub mittels Investitionen aus den beschlossenen wirtschaftlichen 
Wiederaufbauplanen in die Digitalisierung und das notwendige ergänzende 
(unternehmerische und öffentliche) immaterielle Kapital unterstützt werden. 
Wenn die Mittel auf diese Weise verwendet werden, können wir erwarten, dass 
sich das Wachstum der Arbeitsproduktivitätin der Zeit nach COVID-19 beschleu- 
nigt. Zweitens müssen die laufenden Investitionen in IKT und in immaterielle 
Vermögenswerte von wachstumsfördernden Reformen auf der Angebotsseite 
auf den Arbeits-, Produkt- und Dienstleistungsmärkten in den größeren Volks- 
wirtschaften des Euroraums wie Italien flankiert werden. Dies sollte die not- 
wendige Konvergenz der Lohnstückkosten gegenüber Deutschland bewirken. 

Ein Post-COVID-19-Szenario lässt höchstwahrscheinlich einen deutlichen 
Anstieg des Arbeitsproduktivitätswachstums vermuten. Dies hängt jedoch da- 
von ab, ob der gegenwärtig stattfindende Digitalisierungsschub mit Investitio- 
nen in die Digitalisierung sowie in das notwendige ergänzende (unternehmeri- 
sche und öffentliche) immaterielle Kapital flankiert wird. 
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Zwei Rätsel der Produktivität — eine empirische 
Beobachtung 


Henrique Schneider 


Einleitung 


Neben dem „Rätsel der Produktivität” in seiner üblichen Form - entwickelte, in- 
vestitionsintensive und „digitale“ Wirtschaften weisen einen nur geringen An- 
stieg der Produktivität aus — hätte man im Jahr 2020 ein zweites Rätsel erken- 
nen können: Wie kann es sein, dass gerade in einer Zeit der Krise oder Rezession 
die Arbeitsproduktivität steigt? 

Während des ersten Halbjahres 2020 fanden in verschiedenen europä- 
ischen Ländern sogenannte Lockdowns statt. Es waren Maßnahmen zur Ein- 
dämmung der COVID-19-Pandemie. Einzelne wirtschaftliche Aktivitäten wie 
etwa der Handel oder die Gastronomie konnten gar nicht mehr ausgeführt 
werden. Andere Sektoren, so zum Beispiel die Industrie oder die Finanzdienst- 
leistungen, konnten nur unter Einhaltung von Schutzkonzepten weiter funkti- 
onieren. Heim- und andere Modalitäten der Fernarbeit wurden empfohlen und 
praktiziert. Die Wertschöpfung brach ein. Mit dem Anstieg der Arbeitslosigkeit 
und der Beanspruchung von Kurzarbeit nahm die Zahl der geleisteten und be- 
zahlten Arbeitsstunden ebenfalls ab. Gerade in diesem Zusammenhang stieg 
die Arbeitsproduktivität aber markant an - gemäß der Statistik. 

Dieser Beitrag geht dem Rückgang des Produktivitätsfortschritts aus em- 
pirischer Perspektive nach und findet in der Steigerung der Produktivität im 
ersten Halbjahr 2020 eine weitere Facette, die zu beobachten ist: die Multifak- 
torproduktivität. 

Nach einer kurzen Rekapitulation der Ausgangslage folgt eine empirische 
Darstellung der Produktivitätsentwicklung im ersten Halbjahr 2020. Daran 
schließt sich eine ebenso empirisch begründete Diskussion der Multifaktorpro- 
duktivität an. Abschließend werden Schlussfolgerungen gezogen und Desidera- 
te für weitere die Forschung geortet. 
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Allgemein-abstrakt ist Produktivitat das Verhaltnis von Output zu Input, wobei 
vor allem die Entwicklung dieses Verhaltnisses im Lauf der Zeit von Interesse ist. 
In der ökonomischen Theorie, vor allem in der Makroökonomie haben sich drei 
Produktivitätsmaße etabliert: die Arbeitsproduktivität, die Kapitalproduktivität 
und die Multifaktorproduktivität (auch totale Faktorproduktivität genannt). 

Die Arbeitsproduktivität entspricht der realen Wertschöpfung pro geleis- 
teter Arbeitsstunde. Volkswirtschaftlich kann man die Veränderungsrate der 
Arbeitsproduktivität definieren als die Differenz zwischen der Entwicklungsra- 
te des Bruttoinlandsprodukts (BIP) und der Veränderung des Arbeitsinputs.1 

Die Kapitalproduktivität misst die durch die Kapitalleistungen realisierte 
Wertschöpfung. Das Wachstum der Kapitalproduktivität entspricht der Diffe- 
renz zwischen der Entwicklung des Bruttoinlandsprodukts und der Verände- 
rung des Kapitalinputs.? 

Sowohl mit der Arbeitsproduktivität als auch mit der Kapitalproduktivi- 
tät werden nur bestimmte Elemente der Produktivität gemessen. Man spricht 
deshalb von Teilmaßen. Die Produktivität hängt aber von sämtlichen Produkti- 
onsfaktoren und ihrer Kombination ab. Es ist deshalb schwierig, das tatsächlich 
für die Produktivität verantwortliche Element zu isolieren. Mit der Multifaktor- 
produktivität lässt sich die volkswirtschaftliche Effizienz umfassender messen. 
Sie entspricht der Bruttowertschöpfung zu Vorjahrespreisen pro kombinierter 
Faktoreinheit (Kapital, Arbeit usw.). Bei dieser Messung werden gleichzeitig 
Arbeit und Kapital berücksichtigt, womit der Beitrag dieser beiden Produkti- 
onsfaktoren zum Wirtschaftswachstum als ein Bündel betrachtet wird. Die Ent- 
wicklungsrate der Multifaktorproduktivität entspricht der Differenz zwischen 
der Veränderung der Bruttowertschöpfung und der Veränderung des gesamten 
Faktorinputs.? 

Die Arbeitsproduktivität ist das am breiteste verwendete volkswirtschaft- 
liche Produktivitätsmaß. Sie beeinflusst Tarifverhandlungen oder Erwägungen 
zum Mindestlohn und findet deshalb in der Presse und in der Politik erhöhte 
Aufmerksamkeit.* Die Entwicklung der Arbeitsproduktivität ist in Verlangsa- 


1 OECD (2015). 
2 OECD (2015). 
? Schneider (2020). 
* Burda (2018). 
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mung begriffen. Das gilt für Deutschland, für Europa und für praktisch alle ent- 
wickelten Wirtschaften, etwa für die Mitglieder der Organisation für ökonomi- 
sche Zusammenarbeit und Entwicklung (OECD). 

Eine Übersicht über diese Entwicklung bietet Abbildung. Sie zeigt die Ver- 
änderung der Arbeitsproduktivität im Vorjahresvergleich in Prozent für die 19 
Mitglieder der Eurozone, die 28 Länder der EU, die gesamte OECD-Gruppe sowie 
für Deutschland, Frankreich und die USA. 


Veränderung ggü. dem Vorjahr in % 


2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 2019 
Jahr 


— Eurozone OECD seeeee Frankreich Deutschand USA 


Abb.1: Entwicklung der Arbeitsproduktivität in Prozent im Vergleich mit dem Vorjahr 
Quelle: OECD (20200). 


Die hier betrachtete Zeitreihe fängt mit dem Jahr 2009 an. Damals waren die 
Veränderungsraten der Produktivität gering oder sogar negativ. In den unmittel- 
baren Folgejahren nahmen sie zu. Die naheliegende Interpretation ist, dass die 
Wertschöpfung pro Arbeitsstunde während der Großen Rezession 2007 bis 2009 
abnahm und dann in der Erholungsphase bis zum Jahr 2011 wieder zunahm. In 
den Jahren 2012 bis 2016 pendelte sich das Wachstum der Arbeitsproduktivität 
aufumetwaı% pro Jahr ein. In den Jahren 2016 und 2017 stieg diese Veränderung 
an, doch in den Jahren 2018 und 2019 fiel sie stark — bis etwa zur Nullmarke. 


> Kuntze/Mai (2020). 


6 OECD (2020a). Die Berechnung erfolgt mittels der oben genannten Technik als Output, gemessen 
in Bruttoinlandsprodukt, und Input, gemessen an der Zahl der geleisteten Arbeitsstunden. 
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An dieser Stelle gilt es, zweierlei zu beachten. Erstens legen diese Zahlen 
nahe, dass Deutschland die Entwicklung der Produktivitat in den Vergleichs- 
gruppen jeweils um etwa ein Jahr vorwegnimmt. Das hat vermutlich mit der 
Stellung der deutschen Wirtschaft als „Konjunkturmotor“ zu tun.” Zweitens 
entwickelt sich die Produktivität in einem schmalen Rahmen. Gerade diese Ent- 
wicklung gilt als einer der Belege für das „Rätsel der Produktivität“. 

Es bestehen verschiedene Erklärungen für dieses „Rätsel“, wobei sich kein 
Forschungskonsens erkennen lässt. Auf der einen Seite versuchen einige, die 
Verlangsamung der Entwicklung der Arbeitsproduktivität mit Rückgriff auf 
die Digitalisierung, auf ,Baumol’s disease“, auf Regulierung oder auf den Zu- 
sammenbruch des Innovations-Diffusions-Mechanismus zu erklären. Während 
ein Teil der Forschung sagt, aus der Digitalisierung folgten keine wesentlichen 
Impulse für die Erhöhung der Produktivität, meint der andere Teil, die Digi- 
talisierung befinde sich erst in einer Aufbauphase. Wenn diese Phase einmal 
abgeschlossen sei, entwickelten sich die Produktivitatspotenziale.? ,Baumol’s 
disease“ bezeichnet die Problematik der schlechten Rationalisierbarkeit von 
Dienstleistungen im Vergleich mit den Outputs anderer Sektoren. Als Bereit- 
steller von (Über-)Kapazitäten hat der Dienstleistungssektor von vornherein 
höhere Fixkosten und ist daher grundsätzlich weniger produktiv — im Sinne der 
üblichen Messtechnik.1° 

Ein anderer Ansatz findet die Erklärung für das Rätsel in der zunehmen- 
den Regulierung, welche auch Handelshemmnisse einführt. Regulierung wirkt 
sich dabei als nicht rationalisierbarer Fixkostenblock aus, was wiederum zu 
hoher Kostenremanenz führt.!! Der Zusammenbruch des Innovations-Diffusi- 
ons-Mechanismus sagt wiederum, dass derzeit nur wenige Unternehmen pro- 
duktivitätssteigernde Innovationen entwickeln. Zudem bleiben diese Innova- 
tionen proprietär und werden von anderen Unternehmen weder nachgeahmt 
noch integriert.!? Damit entwickelt sich eine zunehmende Disparität zwischen 
innovativen und produktiven Unternehmen und solchen, die es nicht sind. 


7 Karremans (2020). 

3 Gordon (2016). 

? Van Ark (2016). 

10 Baumol/Bowen (1966). 
Lemieux (2018). 

2 OECD (2015). 


Zwei Ratsel der Produktivitat — eine empirische Beobachtung 87 


Auf der anderen Seite zweifelt die sogenannte Mismeasurement-Hypo- 
these an der statistischen Grundlage der Messung der Produktivität. Gemäß 
dieser Hypothese müsste das Bruttoinlandsprodukt um „Intangibles“ erweitert 
werden. Diese beinhalten etwa Güter, die gratis sind - so die Suche im Internet 
und viele digitale Applikationen -, Qualitätsverbesserungen oder auch das geis- 
tige Eigentum. Daraus folgt, dass die Messtechniken zur Erfassung sowohl der 
Wertschöpfung als auch der Produktivität einer Aktualisierung bedürfen. Arbei- 
ten an einer entsprechenden Erweiterung der Konzepte und Techniken werden 
unter anderem in dieser Publikation vorgestellt. Weitere Arbeiten sind etwa die 
CHS-Referenzrahmen"? und die Arbeiten der KLEMS-Initiative.!* 

Eine Überprüfung dieser Erklärungen anhand der zur Verfügung stehen- 
den Daten zeigt kein konklusives Bild. Die oben angesprochenen Ansätze wer- 
den durch die Daten teilweise plausibilisiert und teilweise widerlegt.!° Aber 
auch die „Mismeasurement“-Hypothese ist umstritten. Auch die unterschied- 
lichen statistischen Erweiterungen des Bruttoinlandsprodukts haben bisher 
nicht zu einer nennenswert höheren Produktivität geführt.!® 

Eine weitere Lücke ist, dass viel weniger über die Kapital- und Multifak- 
torproduktivität geforscht wird als über die Arbeitsproduktivität.'” Diese beide 
Aspekte werden meist als Erklärungsfaktoren der Arbeitsproduktivität behan- 
delt. Zwar werden mittlerweile verschiedene Formen des Kapitalaufbaus unter- 
schieden — man ist der Digitalisierung entgegengekommen und unterschiedet 
zwischen ICT- und Nicht-ICT-Kapital. ICT steht für Informatik und Telekommu- 
nikation beziehungsweise „information and communications technology“.!® 
Doch schon etwa bei der Multifaktorproduktivität gibt es kaum Fortschritte in 
der Forschung. 

Der vorliegende Beitrag versucht, diese Forschungslücke zu schließen, in- 
dem er die Änderung der Multifaktorproduktivität als mögliche Erklärung für 
den Anstieg der Arbeitsproduktivität im ersten Halbjahr des Jahres 2020 heran- 
zieht. Dies geht mit einer Erweiterung des Konzepts einher. 


33 Corrado/Hulten/Sichel (2009), Corrado/Hulten (2010). 
14 Jorgenson (2017). 

13 Schneider (2020). 

16 Syverson (2017). 

7 Ahmed/Bhatti (2020). 

18 Cardona et al. (2013). 
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Produktivitat wahrend des COVID-19-Lockdowns 


Wahrend des ersten Halbjahrs 2020, der Zeit des sogenannten Lockdowns, ist 
die Produktivitat der Arbeit sprunghaft angestiegen. Abbildung 2 zeigt, dass 
in den zum Vergleich herangezogenen Landern die Produktivitat wahrend des 
ersten Halbjahres 2020 höher ausfiel als im Durchschnitt der Dekade 2009 bis 
2019. In Deutschland kletterte die Wachstumsrate von 1% auf mehr als 3%, in 
Frankreich auf fast 6 %, und auch in den USA kam zu einer Erhöhung von 0,5 % 
auf 1,7 %.19 
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Abb.2: Entwicklung der Arbeitsproduktivität in Prozent im ersten Halbjahr 2020 
Quelle: Schneider (2020). 


Freilich ist im Umgang mit solchen Zahlen und ihren Veränderungen Vorsicht 
geboten. Sie beinhalten einen Basiseffekt. Zwar ist die Wertschöpfung in den 
betroffenen Ländern eingebrochen, doch die Zahl der geleisteten Arbeitsstun- 
den ist noch stärker zurückgegangen. Wenn der Nenner stärker abnimmt als 
der Zähler, ist die Änderungsrate positiv, nimmt die Produktivität also zu. Selbst 
hier ist noch zu berücksichtigen, dass einige dieser Zahlen provisorische Schät- 


12 Schneider (2020). 
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zungen sind beziehungsweise zum Zeitpunkt der Entstehung der Studie, aus der 
sie stammen, waren.2° 

Trotzdem ist die Arbeitsproduktivität während des Lockdowns angesprun- 
gen. Interessant in diesem Zusammenhang ist nicht die genaue Bezifferung des 

Anstiegs, sondern das Spektrum der Erklärungen dafür. Die relevantesten Grup- 

pen von Erklärungen sind: 

1. Deregulierung und Digitalisierung. Zumindest in der kurzen Frist haben De- 
regulierung und Digitalisierung die Produktivität erhöht. Während der 
COVID-19-Pandemie lockerten die meisten Wirtschaften ihre starren Ar- 
beitsgesetze und ließen vermehrt Fern- und Telearbeit zu. Gleichzeitig öffne- 
ten sich die Unternehmen dafür, vermehrt Technologien in die entsprechen- 
den Arbeitsprozesse ihrer Mitarbeitenden zu integrieren. Es stellt sich nun 
die Frage, ob die Regulatoren und der private Sektor bereit sind, die Deregu- 
lierung und Digitalisierung fortzusetzen. Falls ja, könnte die Produktivität 
weiter steigen -höchstwahrscheinlich nicht mit der gleichen Geschwindig- 
keit wie während dieses kurzen hier betrachteten Abschnitts, aber zumin- 
dest mit einer höheren Rate als im Durschnitt der Jahre von 2010 bis 2018. 

2. Steuerung und Verbesserung betrieblicher Prozesse. Die Kombination aus Ratio- 
nalisierung von Prozessen, durchdachter Koordination und Konzentration 
auf selbstgesteuerte Arbeit ist eine weitere Erklärung für den Produktivi- 
tätsanstiegs. In diesem Ansatz geht es nicht um exogen gegebene Tech- 
nologie oder Regulierung, sondern um endogen in den Betrieben erzielte 
Steuerungs- und Verbesserungsgewinne. Diese wurden etwa mit Prozessor- 
ganisation, „lean management“, „Management by Objectivess“ („MbO“) oder 
der Übertragung einer gewissen industriellen Logik auf Dienstleistungen 
(Schichten, Takt, Ergebniskontrolle, Kapazitätsminimierung) erzielt. So ge- 
wonnene Produktivitätssteigerungen können auch unabhängig von Digi- 
talisierung und Deregulierung umgesetzt werden. 

3. ,,Mismeasurement” und Externalitäten. Auch in dieser Situation ließe sich die 
„Mismeasurement“-Hypothese formulieren: Der Produktivitätsschub kam 


2° Der Beitrag von Felix Roth in diesem Band kommt zu einem anderen Ergebnis. Roth stellt heraus, 
dass die Produktivität pro erwerbstätiger Person im gleichen Bezugsjahr abnimmt. Dieser Unter- 
schied geht auf die unterschiedlichen Messtechniken zurück. Roth stützt sich auf Berechnungen 
der Europäischen Kommission, welche die Produktivität als Wertschöpfung pro erwerbstätiger Per- 
son berechnet; dieser Beitrag nimmt das OECD-Maß, nämlich die Wertschöpfung pro geleisteter 
Arbeitsstunde. Zur Plausibilisierung: Wenn eine erwerbstätige Person in Kurzarbeit ist, bleibt sie 
erwerbstätig und damit Teil des Nenners in der Berechnung; da sie aber nicht oder weniger arbeitet, 
entfallen geleistete Arbeitsstunden, was wiederum den Nenner der Berechnung kleiner macht. 
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nur zustande, weil die ökonomischen Messgrößen die mit den gesundheits- 
politischen Maßnahmen einhergehenden Externalitäten nicht berücksich- 
tigen. In diesem Fall handelt es sich bei den Externalitäten um die höhere 
Wahrscheinlichkeit von Depressionen oder anderen psychologischen Aus- 
wirkungen auf die Menschen, die nicht oder weniger arbeiten; um mehr 
Stress für Menschen, die mit erhöhter Flexibilität oder aus der Ferne arbei- 
ten; oder um den Verlust sozialer Kontakte am Arbeitsplatz. Einige dieser 
Externalitäten bleiben auch dann bestehen, wenn die Menschen zu ihren 
Arbeitsroutinen zurückkehren. Was auf den ersten Blick wie ein Produktivi- 
tätsschub aussieht, ist gemäß diesem Ansatz eine Fehlanzeige. 
Insgesamt und aus volkswirtschaftlicher Perspektive kann der signifikante 
Anstieg der Produktivität im ersten Halbjahr 2020 zumindest als Indikator für 
entsprechende noch nicht umgesetzte Produktivitätspotenziale gelten. Der In- 
dikator könnte also bedeuten, dass Arbeitszeit vorhanden ist, die bezahlt, aber 
nicht ausgelastet wird, oder dass Arbeitszeit mittels des Einsatzes von Techno- 
logie oder Flexibilität oder einfach durch besseres Management zu mehr Output 
führen kann. 

Die erste und die zweite Gruppe von Erklärungen, so unterschiedlich sie 
sind, führen die Erhöhung der Arbeitsproduktivität auf die Disposition von Ar- 
beit beziehungsweise auf die Kombination von Arbeit und Kapital zurück. Man 
kann sie auch als Freisetzungsproduktivitätsgewinn bezeichnen. Gemäß bei- 
den Gruppen von Ansätzen ist der Anstieg der Arbeitsproduktivität auf die Mul- 
tifaktorproduktivität zurückzuführen. Die dritte Gruppe von Erklärungen wählt 
einen anderen Weg.. Gemäß ihr ist die Arbeitsproduktivität schlicht ein schlech- 
tes Maß oder sie kann nicht alle Externalitäten einbeziehen, die der Lockdown 
mit sich brachte. Dieser Vorwurf, so ernst er zu nehmen ist, steht nicht im Wi- 
derspruch zu den beiden ersten Gruppen, sondern ergänzt sie. Darauf wird spä- 
ter zurückzukommen sein. 


Multifaktorproduktivität 


Die Multifaktorproduktivität wird als Residualgröße berechnet; entsprechend 
wurde sie lange als Produktivitätsgewinn, der sich nicht eindeutig auf Arbeit 
oder Kapital zurückführen lässt, verstanden.2! Doch im Laufe der Überprüfung 


2! Cantner et al. (2007). 
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der „Mismeasurement“-Hypothese stellten verschiedene Gruppen von For- 
schenden eine leichte, aber immerhin positive Korrelation zwischen der Kapi- 
talintensivierung allgemein und der Multifaktorproduktivität fest. Seither ver- 
suchen sie, die Multifaktorproduktivität als Technologieproduktivität zu lesen. 
Sie interpretieren die Multifaktorproduktivität auch als „kostenlose“ Innovation 
oder als Dispersion von Wissen seitens der Innovatoren auf andere Akteure.?? 

Das ist eine mögliche, aber zu eng gefasste Interpretation der Multifak- 
torproduktivität. Selbst wenn ein Zusammenhang zwischen der Kapitalinten- 
sivierung und der Multifaktorproduktivität besteht, heißt dies noch nicht, dass 
Änderungen der Multifaktorproduktivität allein auf Kapitalintensivierung 
zurückzuführen sind. Als Maß für die Gesamtproduktivität kann die Multifak- 
torproduktivität alles inkludieren, was in nicht „perfekten“ Märkten passiert: 
Neben dem technologischen Fortschritt gehören dazu unter anderem auch 
Innovationseffekte, Änderungen von Organisationsformen und Institutionen, 
Messfehler, Skaleneffekte und Externalitäten.?3 

Eine weitere Interpretation der Multifaktorproduktivität ist, sie als Maß 
für die Qualität des Managements zu sehen. Management wird dabei als Un- 
ternehmensführung verstanden, das heißt als Auswahl und Einsatz von Arbeit, 
als Entscheid über Kapitalinvestitionen und als Disposition von Arbeit und Ka- 
pital. Die beiden im vorherigen Abschnitt genannten Gruppen von Erklärungen 
scheinen eher dieses Verständnis der Multifaktorproduktivität zu plausibili- 
sieren. Als die Daten zur Produktivitätsentwicklung im ersten Halbjahr 2020 
ausgewertet wurden, wurden die Ergebnisse im Rahmen eines Panels mit Un- 
ternehmerinnen und Unternehmern validiert. Die Teilnehmenden zeigten sich 
über den Produktivitätszuwachs während des Lockdowns nicht erstaunt. Auch 
sie führten die Steigerung auf Management-Maßnahmen zurück - so wie die 
erste und zweite Gruppe von Erklärungen es taten. Die Teilnehmenden blieben 
jedoch vorsichtig. Sie äußerten die Vermutung, der erhöhte Produktivitätsstan- 
dard lasse sich nicht ewig halten. Die meisten Teilnehmenden waren auch der 
Überzeugung, dass verschiedene Dinge, etwa Externalitäten oder die Vorläu- 
figkeit der Maßnahmen, mit aktuellen Methoden gar nicht gemessen werden 
könnten. Also doch „Mismeasurement“.?* 


22 Van Ark et al. (2009); Corrado et al. (2009). 
23 Hulten (2001). 
24 Schneider (2020). 
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Trotz möglicher Verkürzungen eröffnet die Interpretation der Multifaktor- 
produktivität als Qualität des Managements gewisse Perspektiven. Sie erlaubt 
beispielsweise eine Verknüpfung mit der Effizienzdiskussion in der Betriebs- 
wirtschaftslehre. Die Steuerung und Verbesserung der Produktivität wird dort 
als eine der wichtigsten Aufgaben des Managements verstanden. Entsprechend 
wurden dafür verschiedene Erfassungs- und Steuerungsinstrumente entwi- 
ckelt, zum Beispiel die „Balanced Scorecard“ oder das „Benchmarking.“ Eine so 
verstandene Multifaktorproduktivität würde als volkswirtschaftliche Kennzahl 
die betriebswirtschaftlichen Fortschritte einer Wirtschaft erfassen und damit 
unter anderem auch die Diffusion von Wissen, Know-how, Technologie einbe- 
ziehen.?> Als Produktivitätsgesamtmaß kann die so verstandene Multifaktor- 
produktivität auch die „Intangibles“ umfassen. 

Vorsicht ist geboten. Auch in dieser Interpretation wäre die Multifaktor- 
produktivität zwar ein Indikator für die Qualität des Managements, was wie- 
derum die Adaption von Technologie, die Dispersion von Wissen und Know- 
how, die Innovation und anderes beinhaltet, aber sie wäre dies nur aus höherer 
Warte tun. Eine genaue Zerlegung der Bestimmungsfaktoren der Qualität des 
Managements ist mit einer Residualgröße nicht möglich. Dennoch: Was zeigt 
eine empirische Untersuchung der Multifaktorproduktivität? Werden die oben 
angesprochenen Perspektiven tatsächlich eröffnet? 


Eine empirische Anzeige 


Empirisch gehört die Multifaktorproduktivität zu den am wenigsten recher- 
chierten Gebieten der Ökonomik. Auch die entsprechenden statistischen Ämter 
sind meist zurückhaltend in der Publikation von Zahlen dazu. Abbildung 3 zeigt 
die Entwicklung der Multifaktorproduktivität in Deutschland, Frankreich und 
den USA in den letzten zehn Jahren. Es handelt sich jeweils um die prozentuale 
Änderung im Vergleich mit dem Vorjahr. 

Gerade im Vergleich mit der Entwicklung der Arbeitsproduktivität fällt die 
leicht höhere Volatilität der Multifaktorproduktivität auf. In Deutschland ent- 
wickelt sich die Multifaktorproduktivität leicht stärker als die Arbeitsprodukti- 
vität. Das istin den USA und Frankreich umgekehrt. 


25 Erken et al. (2018). 
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Abb.3: Entwicklung der Multifaktorproduktivität in Prozent im Jahresvergleich 
Quelle: OECD (2020b). 


Die OECD nimmt in ihren „Productivity Statistics 2019“ eine genauere Unter- 
suchung der Entwicklung der Multifaktorproduktivität vor.?° Abbildung 4 stellt 
das Ergebnis dieser Analyse dar. Dort werden Deutschland mit Frankreich und 
den USA über eine lange Periode von 1995 bis 2017 verglichen. Diese Periode 
wird in zwei kürzere eingeteilt, 2001 bis 2007 und 2010 bis 2017. Über die lan- 
ge Periode weisen alle Länder ein durchschnittliches Wachstum der Multifak- 
torproduktivität von weniger als 1% pro Jahr auf, wobei die USA den höchsten 
Durchschnitt erzielt, gefolgt von Deutschland und Frankreich. Konzentriert man 
sich allerdings auf die kürzeren Perioden, so stellt man fest, dass die USA und 
Frankreich eine Verlangsamung des Wachstums der Multifaktorproduktivität 
verzeichnen, während sich dieses in Deutschland stetig erhöht. Die deutsche 
Wirtschaft steigert also die Produktivität der gesamten Wirtschaft; ihr Durch- 
schnitt für die Periode 2010 bis 2017 lag bei beinahe 1% und damit deutlich hö- 
her als in den USA und Frankreich. 


26 OECD (2019). 
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Abb. 4: Entwicklung der Multifaktorproduktivität in einer langen Periode und unterteilt in zwei kürzere 
Quelle: OECD (2019). 


Die OECD?” geht einen Schritt weiter und versucht herauszufinden, welchen Ef- 
fekt die Multifaktorproduktivität auf die Arbeitsproduktivität hat. Die Arbeits- 
produktivitätkann analytisch auch als eine Funktion von Kapitalintensivierung 
und Multifaktorproduktivitat bestimmt werden.?® Dabei wird vermutet: Je hö- 
her die Kapitalintensivierung, desto höher die Arbeitsproduktivität; je höher die 
Multifaktorproduktivität, desto höher die Arbeitsproduktivitat; und je höher 
das Produkt aus Kapitalintensivierung und Multifaktorproduktivität, desto hö- 
her die Arbeitsproduktivität. 

Die OECD unterscheidet dabei zwei Formen der Kapitalintensivierung: 
jene des ICT-Kapitals — das ist der Kapitalbestand in Informations- und Kommu- 
nikationstechnik — und jene des Nicht-ICT-Kapitals. 

Abbildung 5 zeigt die durchschnittliche jährliche Veränderung der Arbeits- 
produktivität für zwei Perioden, für die Jahre 2001 bis 2007 und für die Jahre 
2010 bis 2017. Diese durchschnittlichen Veränderungsraten werden jeweils zer- 
legt in Intensivierung des ICT-Kapitals, Intensivierung des Nicht-ICT-Kapitals 
und Veränderung der Multifaktorproduktivität. Dabei ergeben hier die Summe 
aus Multifaktorproduktivität und Intensivierungen die Veränderungsrate der 
Arbeitsproduktivität (dargestellt als Punkt; als Summe dieser Faktoren). 


27 OECD (2019). 
28 Wiegmann (2008). 
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Abb.5: Zerlegung der Arbeitsproduktivität in Kapitalintensivierung und Multifaktorproduktivität 
Quelle: OECD (2019). 


Für die Periode 2001 bis 2007 verzeichnen alle hier verglichenen Volkswirtschaf- 
ten positive Impulse aus allen Zerlegungsfaktoren. In den USA und Frankreich 
fallen die Beiträge der Intensivierung des ICT-Kapitals und des übrigen Kapitals 
jeweils beinahe gleich aus. In Deutschland scheint das ICT-Kapital einen wich- 
tigeren Beitrag zu leisten als das Nicht-ICT-Kapital. In allen Wirtschaften erklärt 
der Beitrag der Multifaktorproduktivität mindestens die Hälfte der Verände- 
rung der Arbeitsproduktivität. 

In der Periode 2010 bis 2017 ist das Bild weniger homogen. Die Multifak- 
torproduktivität bleibt in allen Volkswirtschaften wichtig, doch sie ist unter- 
schiedlich wichtig. In Deutschland erklärt sie fast 90 % der Veränderung der 
Arbeitsproduktivität, in den anderen Ländern zwischen 30 und 45 %. Die Inten- 
sivierung des Nicht-ICT-Kapitals leistet in den USA und in Deutschland einen 
leicht negativen Beitrag; in Frankreich gehen hingegen 21 % des Wachstums der 
Arbeitsproduktivität auf die Intensivierung des Nicht-ICT-Kapitals zurück. In 
allen hier betrachteten Volkswirtschaften trägt die Intensivierung des ICT-Ka- 
pitals zur Erhöhung der Arbeitsproduktivität bei. In den USA ist dieser Beitrag 
sogar der größte in dieser Zerlegung, das heißt die Intensivierung des ICT-Kapi- 
tals leistet einen größeren Beitrag zur Erklärung der Arbeitsproduktivität als die 
Multifaktorproduktivität. 

Gemäß diesen Zahlen geht also die Entwicklung der Arbeitsproduktivität 
in Deutschland fast vollständig auf die Multifaktorproduktivität zurück — das 
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heißt auf Faktoren wie die Qualität des Managements, Entscheidungen zum 
Einsatz der Arbeit sowie die Kombination mit dem Kapital oder die Prozessge- 
staltung. Wenn der Anstieg der Produktivität während des ersten Halbjahres 
2020 hauptsächlich mit der Multifaktorproduktivität zu tun hatte, dann hat in 
Deutschland die Entwicklung der Arbeitsproduktivität schon seit langem und 
vor allem mit dieser Multifaktorproduktivität zu tun. 


Schlussfolgerung 


Was ist das Ergebnis nun? Generell lässt sich sagen: 

- Die Messung der Arbeitsproduktivität, so wie sie heute Usus ist, zeigt eine 
nachlassende Dynamik. 

- Während des Lockdowns im ersten Halbjahr 2020 konnten hingegen Pro- 
duktivitätsverbesserungen umgesetzt werden. 

- Diese gehen vermutlich mit der Ausnutzung von punktueller Flexibilisie- 
rung, Deregulierung, Digitalisierung und selbstgesteuerter Arbeit einher, 
also gehen sie auf eine höhere Multifaktorproduktivität zurück. 

- Diese Erklärung wird auch dadurch plausibilisiert, dass in Deutschland die 
Multifaktorproduktivität beinahe 90 % der Arbeitsproduktivität erklärt. 

- In Deutschland zeigt die Multifaktorproduktivität tendenziell eine Verbes- 
serung über die Zeit an, was im Kontrast zu ihrer Entwicklung etwa in den 
USA und Frankreich steht. 


Und trotzdem sind nicht alle Fragen beantwortet worden. Das Gegenteil ist der 

Fall. Die Betrachtung der Entwicklung der Arbeitsproduktivität unter Rückgriff 

auf die Multifaktorproduktivität führt zu weiteren Fragen, welche allesamt For- 

schungsdesiderate sind: 

- Wie ist die Multifaktorproduktivität zu interpretieren? Wie kann sie gelesen 
werden, sodass sie die Verbesserungen der Managementqualität anzeigt? 

- Welche Rolle spielen „Intangibles” für die Multifaktorproduktivität? Wenn 
sie gemäß der „Mismeasurement”-Hypothese von der Erfassung der Wert- 
schöpfung ausgeschlossen werden, wie ist es dann möglich, dass das Wachs- 
tumsresiduum sie dennoch einschließt? 

- Wenn die Multifaktorproduktivität streng rechnerisch eine Residualgröße 
ist, warum erklärt sie ausgerechnet in Deutschland beinahe 90 % der Ar- 
beitsproduktivität? 
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- Welche anderen, präziseren Wege gibt es, die Multifaktorproduktivität zu 
interpretieren? 

- Selbst dann, wenn die Multifaktorproduktivität nicht eine Lösung für die 
„Mismeasurement”-Hypothese ist: Wie kann sie nützlich gemacht werden, 
um das Problem besser zu verstehen??? 
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Teil 2: Neue empirische Verfahren 
für die Datenökonomie 


Nowcast als Forecast 


Neue Verfahren der BIP-Prognose in Echtzeit 


Christina Heike Maafs 


Einleitung 


(Finanz-)politische Entscheidungen werden meist nach Bewertung aktueller 
und zukünftig erwarteter ökonomischer Entwicklungen getroffen.! Dafür benö- 
tigen Entscheidungsträger:innen aus der (Wirtschafts-) Politik beziehungswei- 
se aus den Zentralbanken möglichst aktuelle Konjunkturdaten, um bestmöglich 
Einfluss auf die gegenwärtige Wirtschaftslage ausüben zu können.? Da wichtige 
volkswirtschaftliche Kennzahlen wie das Bruttoinlandsprodukt (BIP) zumeist 
nur in mehrmonatigen Intervallen und mit Verzögerung veröffentlicht werden, 
ist der Großteil der etablierten Indikatoren in Zeiten beschleunigter wirtschaft- 
licher Veränderungen nicht mehr agil genug.? Deswegen befassen sich Öko- 
nom:innen tiefgehend mit der Verbesserung des makroökonomischen Monito- 
rings in Echtzeit, um ein Verfahren zu entwickeln, mit dem die Gegenwart und 
die nahe Vergangenheit prognostiziert werden konnen.4 

Eine Prognose des gegenwärtigen Zustands beziehungsweise der nahen Zu- 
kunft oder Vergangenheit, am Rande der verfügbaren Daten, wird als „Nowcast“ 
bezeichnet.5 Dieser Begriff setzt sich aus den englischen Wörtern now (jetzt) und 
forecast (Prognose) zusammen. Er bedeutet das Beobachten der aktuellen Wirt- 
schaftslage in Echtzeit durch Prognose der Gegenwart, wobei die gegenwärtige 


1 Giannone/Reichlin/Small (2008), S. 665. 

2 BMWi (2019), S. 12; Giannone/Reichlin/Small (2008), S. 665; Cepni/Guney/Swanson (2020), S. 18. 
3 Aastveit et al. (2014), S.48; Giannone/Reichlin/Small (2008), 5.665; Hauf/Stehrenberg/Zwick (2020), S. 52. 
4 Aastveit et al. (2014), S. 48; Stock/Watson (2017), S. 72. 

° Armstrong (2004), S. 798; Banbura et al. (2013), S. 196; Sachverstandigenrat (2019), 5. 54. 
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Prognose immer wieder aktualisiert wird. Abstrakter formuliert, besteht bei- 
spielsweise der Nowcast des BIP-Wachstums eines Landes zum Zeitpunkt t, dar- 
gestellt durch die Variable yg, aus der orthogonalen Projektion dieser Variablen 
auf das Informationsset 0: 


Ply [9] = Ely? |v] 


Das Informationsset enthält alle zum Zeitpunkt v verfügbaren Informationen, 
wobei vsich auf das Datum einer bestimmten Datenveröffentlichung bezieht. 
Dabei stellt E[ - |0,]den bedingten Erwartungswert dar.’ 

Datenökonomie und künstliche Intelligenz (KI) eröffnen auch für Pro- 
gnosen der Wirtschaftsleistung neue Möglichkeiten. Als Datenquelle für die 
Erstellung tagesaktueller Vorhersagen eignet sich vor allem der mit der neuen 
Datenökonomie einhergehende Bereich Big Data, da diese Daten für eine Viel- 
zahl von Aktivitäten in Echtzeit und in großen Mengen zur Verfügung stehen. 
Fur die bestmögliche Analyse von Big Data im Bereich Nowcasting erweist sich 
dabei insbesondere die Anwendung von Klin Form des maschinellen Lernens 
(ML) als effizient, da die Methoden des ML die Komplexität und Größe dieser 
Datenart am besten verarbeiten.® 

Abbildung ı vermittelt einen ersten Eindruck von der Genauigkeit von 
Nowcasts. Für den Zeitraum 1.1.2019 bis 31.12.2020 wird der BIP-Nowcast der Fe- 
deral Reserve Bank of New York? für die USA geplottet (dunkelgrau). Demgegen- 
über werden die tatsächlichen Wachstumsraten des US-amerikanischen BIP als 
hellgraue Punkte zum jeweiligen Ende des Quartals!® dargestellt. Diese Werte 
stammen vom Bureau of Economic Analysis (BEA)" der US-Regierung. Es wird er- 
sichtlich, dass der Nowcast die BIP-Entwicklung auch im Verlauf der Coronapan- 
demie (seit Mitte März 2020) relativ gut abbildet. Die Abweichungen in dieser un- 
sicheren Periode sind allerdings um einiges deutlicher als vorher. Eine genauere 
Beschreibung der Grafik erfolgt im weiteren Verlauf dieses Beitrags. 


6 Federal Reserve Bank of New York (2019), S. 66. 
7 Banbura/Giannone/Reichlin (2011), S. 196. 

3 Varian (2014), S. 6. 
° Federal Reserve Bank of New York (2020). 


10 Zum Verständnis dessen auf welches Quartal sich das tatsächliche BIP des Bureau of Economic 
Analysis (BEA) bezieht, wird das tatsächliche BIP am Ende des jeweiligen Quartals anstelle am Tag 
dertatsächlichen Veröffentlichung (einige Wochen später) dargestellt. 


"BEA (2020). 
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BIP Wachstum in % 
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Prognosezeitpunkt 


BIP Nowcast NY FED BIP BEA 


Anmerkung: NY FED = Federal Reserve Bank of New York, BEA = Bureau of Economic Analysis. 


Abb. 1: US-BIP-Wachstum: NY-FED-Nowcast versus BEA 01/19-12/20 
Quelle: Eigene Darstellung, basierend auf BEA (2020) und Federal Reserve Bank of New York 
(2020). 


Dieser Beitrag bietet einen Überblick über die gegenwärtige Nowcast-Literatur 
und untersucht die Möglichkeiten und Grenzen der Erstellung (tages-) aktueller 
Prognosen (sogenannter Nowcasts) der gegenwärtigen Wirtschaftslage mit Big 
Data und ML. Zum Vergleich der verschiedenen Prognosequalitäten wird das 
statistisch-empirische Kriterium Wurzel der mittleren Fehlerquadratsumme 
(root mean square error [RMSE]) angelegt." 

Im folgenden Abschnitt werden zunächst die Eigenschaften des Nowcasts 
genauer beschrieben und anschließend „herkömmliche“ Anwendungsmöglich- 
keiten dieser Methode erläutert. Der nächste Abschnitt geht darauf ein, was un- 
ter dem Begriff Big Data verstanden wird sowie welche Datenquellen aus dem 
Bereich Big Data stammen, und umreißt die Herangehensweise von Verfahren 
des maschinellen Lernens. Anschließend werden Möglichkeiten und Grenzen 
des Nowcasts mit Big Data und maschinellem Lernen diskutiert. Schließlich 
werden die Ergebnisse dieses Beitrags zusammengefasst und es wird ein Aus- 
blick auf potenzielle zukünftige Entwicklungen gegeben. 


2 Pons (2000), 5.54. 
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Tagesaktuelle Prognosen — Nowcasts 


Nowcasts sind Prognosen der Gegenwart. Sie unterscheiden sich von anderen 
Prognoseverfahren jedoch nicht nur dadurch, dass sie anstelle der Zukunft die 
gegenwärtige Lage prognostizieren, sondern auch durch die Asynchronität der 
verwendeten Datenreihen. Die verschiedenen Indikatoren, auf Grundlage de- 
rer ein Nowcast erstellt wird, werden zu unterschiedlichen Zeitpunkten und 
mit unterschiedlichen Frequenzen veröffentlicht - manche Variablen werden 
monatlich veröffentlicht, andere wöchentlich oder sogar täglich —, sodass der 
zugrundeliegende Datensatz unausgewogen ist.'? Da für einen Nowcast immer 
die aktuellsten Kennzahlenwerte genutzt werden, ist der Zeitpunkt der letzten 
verfügbaren Beobachtung in jeder Datenserie verschieden. Daher hat der Ge- 
samtdatensatz, das Informationsset 2, eine spezielle Struktur, die sich „gezackte 
Kante“ (ragged beziehungsweise jagged edge) nennt. 

Des Weiteren wird für die Erstellung eines Nowcasts nicht nur eine Prog- 
nose angefertigt, sondern eine ganze Reihe von Prognosen. Die erste Vorhersa- 
ge wird mit nur ganz wenigen Informationen angefertigt. Sobald neue Daten 
vorliegen, wird die vorherige Schätzung aktualisiert und ein neuer, präziserer 
Nowcast erstellt. Es wird also eine Sequenz von Projektionen E[y2|Qy], E[y2|Qv+1] 
angefertigt, bei der v, v + 1sich auf die Zeitpunkte aufeinanderfolgender Da- 
tenveröffentlichungen beziehen. Normalerweise liegen diese Zeitpunkte dicht 
beieinander und ändern sich. Deswegen hat veine hohe Frequenz und ist un- 
regelmäßig verteilt. Die neueren Prognosen enthalten dabei sowohl mehr In- 
formationen als auch Revisionen vorheriger Daten. Der bestehende Nowcast 
ändert sich nur, wenn die neue Prognose von der alten abweicht, da unerwar- 
tete Informationen, sogenannte News, veröffentlicht wurden. Allerdings geht 
Nowcasting weit über einzelne Prognosen für einen bestimmten Zeitraum hin- 
aus. Ziel ist es viel mehr, einen Rahmen zu entwickeln, der in Echtzeit den Fluss 
an Datenveröffentlichungen lesen kann.!® Deswegen ist Nowcasting nicht nur 
gleichzeitiges Forecasting, da die Nutzung und das Timing gleichzeitiger Daten 
bedeutend andere Komponenten mit sich bringen als vorab Forecasting.!® 


3 Giannone/Reichlin/Small (2008), S. 666; Banbura/GiannonefReichlin (2011), S. 196. 
* Banbura/Giannone/Reichlin (2011), S. 196-197. 

> Banbura et al. (2013), S. 207. 

6 Castle/Fawcett/Hendry (2009), S. 87. 


Nowcast als Forecast 105 


Nowcasts können für sämtliche niederfrequenten Variablen angefertigt 
werden, die mit einiger Verzögerung veröffentlicht werden, für die jedoch höher- 
frequente, frühzeitigere Daten verfügbar sind.” Ursprünglich wurden Nowcasts 
hauptsächlich in der Meteorologie zur minutengenauen Prognose von Gewittern 
verwendet.!® In den letzten Jahren ist die Relevanz dieses Verfahrens jedoch auch 
in der Ökonomie deutlich gestiegen. Dies zeigt sich beispielsweise an den ver- 
stärkten Aktivitäten statistischer Ämter, Institute und Zentralbanken.!? 

Man benötigt Nowcasts in den Wirtschaftswissenschaften, da wichtige 
volkswirtschaftliche Kennzahlen wie das BIP nur vierteljährlich berechnet wer- 
den und erste offizielle BIP-Schätzungen des vergangenen Quartals in vielen 
Ländern erst vier (USA) bis sechs (Eurozone) Wochen nach Ende des Quartals 
veröffentlicht werden. Somit muss in der Eurozone bis circa Mitte Mai (bezie- 
hungsweise Ende April für eine Schnellschätzung) gewartet werden, um erste 
Prognosen für das aktuelle Jahr zu erhalten.2° Aufgrund des immensen volks- 
wirtschaftlichen Interesses am Wirtschaftswachstum liegt der Schwerpunkt 
dieses Kapitels auf der Prognose des BIP. 

Um das gegenwärtige BIP zu prognostizieren, werden früher beziehungs- 
weise häufiger als das BIP veröffentlichte Variablen verwendet, im Idealfall so- 
gar Echtzeitdaten.?! Zum Beispiel wird die Industrieproduktion der Eurozone im 
Januar schon Mitte März veröffentlicht. Dieser Indikator misst einen wichtigen 
Bestandteil des BIP und ist von großer Bedeutung für dessen kurzfristige Ent- 
wicklung.?? Für Deutschland sind außerdem beispielsweise Auftragseingange 
im Verarbeitenden Gewerbe, Produktion im Produzierenden Gewerbe oder der 
ifo Geschäftsklimaindex wichtige Frühindikatoren.?? Diese Kennzahlen zählen 
zu den „harten“ Faktoren. Noch kurzfristigere, möglicherweise aber auch unge- 
nauere Informationen kann man „weichen“ Faktoren wie aktuellen Umfrage- 
werten entnehmen. Werte für BIP-Erwartungen werden häufig schon vor Ende 
des betreffenden Monats veröffentlicht. Zusätzlich können auch sämtliche an- 


7 Banbura/Giannone/Reichlin (2011), S. 194. 
18 siehe Deutscher Wetterdienst (2020) und World Meteorological Organization (2017). 


19 Siehe Deutsche Bundesbank (2020); Federal Reserve Bank of New York (2020); ifo Institut (2021); 
Statistisches Bundesamt (2020). 


° Banbura/Giannone/Reichlin (2011), S. 193-194; Banbura et al. (2013), S. 196. 
1 Banbura et al. (2013), 5.196; Cepni/Guney/Swanson (2020), 5.18. 

2 Banbura/Giannone/Reichlin (2011), 5.193. 

3 BMWi (2019), 5.12. 
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deren Datenveröffentlichungen von Bedeutung sein und die Märkte beeinflus- 
sen,?* beispielsweise Finanzmarktdaten wie Zinsen, Aktien- oder Wechselkur- 
se sowie nachfrageseitige Variablen wie der Stromverbrauch. Darüber hinaus 
eignet sich für die Erstellung tagesaktueller Nowcasts insbesondere die Verar- 
beitung großer Informationsmengen im Bereich Big Data wie Social-Media-Ak- 
tivitäten oder Mobilfunkdaten. Diese Daten können theoretisch in Echtzeit in 
aktuelle Prognosen einfließen. Möglichkeiten und Grenzen dieses Ansatzes 
werden in einem nachfolgenden Abschnitt dieses Beitrags diskutiert. 

Technisch gesehen wurden beim Nowcast des BIP-Wachstums im gegen- 
wärtigen Quartal ursprünglich häufig einfache, kleinmaßstäbige Modelle ver- 
bunden, sogenannte Brückengleichungen (bridge equations). Dabei werden die 
kleinen Modelle genutzt, um die Informationen, die in einer oder mehreren mo- 
natlichen erklärenden Schlüsselvariablen (zum Beispiel Werte für die Industrie- 
produktion oder Umfrageergebnisse) enthalten sind, mit der vierteljährlichen 
Wachstumsrate des BIP zu koppeln, die nach den monatlichen Daten veröffent- 
licht wird. Anhand eines Gleichungssystems wird eine Verbindung zwischen 
der zu prognostizierenden Variablen und den erklärenden Variablen hergestellt. 
Dabei wird überbrückt, dass die Daten alle zu unterschiedlichen Zeitpunkten 
veröffentlicht werden.?® 

Allerdings werden für Nowcasts idealerweise komplexere Modelle ver- 
wendet, bei denen auch die Kommentierung und Interpretation der überarbei- 
teten Schätzungen berücksichtigt wird. Mit den komplexeren Modellen wird 
die Veränderung des BIP nicht nur quantitativ prognostiziert, sondern es wird 
auch qualitativ bestimmt, welche Faktoren hauptsächlich verantwortlich sind. 
Dafür muss die gemeinsame Dynamik der monatlichen Inputvariablen und der 
vierteljährlichen Zielvariablen in einem einheitlichen Rahmen modelliert wer- 
den.?” Prinzipiell kann dafür jedes dynamische Modell verwendet werden, das 
mit verschiedenen Frequenzen und fehlenden Daten umgehen kann und die 
gemeinsame Dynamik der erklärenden und der Zielvariablen abbilden kann.?8 
In der Praxis werden häufig Faktormodelle oder vektorautoregressive Modelle 
(VAR-Modelle) verwendet.22 


N 


4 Bańbura/Giannone/Reichlin (2011), S. 193—194. 

25 Giannone/Reichlin/Small (2008), S. 666. 

26 Deutsche Bundesbank (2018), S. 19—20. 

7 Bańbura/Giannone/Reichlin (2011), S. 194. 

28 Bańbura/Giannone/Reichlin (2011), S. 212. 

2? Sachverständigenrat (2019), S. 54; Deutsche Bundesbank (2018), S. 15. 
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Als statistisch-empirische Kriterien für den Vergleich und die Bewertung 
der Prognosegüte verschiedener Verfahren werden traditionell der mittlere ab- 
solute Fehler (mean absolute error = MAE), die Wurzel der mittleren Fehlerqua- 
dratsumme (root mean square error [RMSE]) und Theils U angelegt.3° Da in den 
fur diesen Beitrag relevanten Papieren tiberwiegend der RMSE angegeben wird, 
wird nachfolgend die Güte der verschiedenen Nowcasts anhand dieses Krite- 
riums bewertet. Der RMSE?! wird durch die Abweichung der prognostizierten 
Werte von der Realitat berechnet. Diese Abweichung wird quadriert, um negati- 
ve und positive Differenzen gleich zu bewerten, es wird der Mittelwert gebildet 
und die Quadratwurzel gezogen. Im Verlauf des Beitrags wird daher immer wie- 
der auf den RMSE eingegangen, um einen Uberblick tiber die Prognosegiite der 
verschiedenen Ansatze zu erhalten. Am Ende des Beitrags werden alle RMSE in 
einer Tabelle einander gegenübergestellt. 


Anwendungsmöglichkeiten von Nowcasts 


Nowcasts sind für eine Vielzahl volkswirtschaftlicher Themengebiete relevant, 
wie Gesundheit, Produktion beziehungsweise Produktivität, Konsumentenver- 
halten und Wirtschaftswachstum. Bei der Formalisierung der Problemstellun- 
gen wird im traditionellen Sinne sowohl auf Partialmodelle wie Brückenglei- 
chungen und MIDAS-Typ-Gleichungen als auch auf gemeinsame Modelle wie 
Faktormodelle und Gemischte-Frequenz-VAR-Modelle zurückgegriffen. Eine 
Besonderheit der VAR-Modelle ist, dass die verwendeten Variablen von ihren 
vergangenen Werten sowie den vergangenen Werten der anderen Variablen 
abhängen.?? 

In einem frühen Standardwerk zur Problematik der zeitverzögerten Be- 
richterstattung?3 untersuchte Jerald Lawless im Jahr 1994 die Berichterstattung 
bei meldepflichtigen Krankheiten. Anhand eines stationären Maximum-Like- 
lihood-Verfahrens mit multinominalem Modell sowie eines nichtstationären Ran- 
dom-Effects-Modells konnte er Trends in der verzögerten Berichterstattung iden- 


30 Pons (2000), S. 54. 
La 
3! Berechnung: RMSE =|;+)'o.-», »= tatsächliche Werte, f = prognostizierte Werte (Gupta/Minai 
2019), S. 372. ue 
32 Deutsche Bundesbank (2018), S. 18. 
33 Englisch: „occured but not reported events“. 
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tifizieren und somit bessere Prognosen bezüglich des Verlaufs von Krankheiten 
erstellen.34 Dies ist insbesondere bei plötzlichen Ausbrüchen essentiell.35 

Deswegen spielt das Nowcasting tatsächlicher Infiziertenzahlen auch 
in der aktuellen COVID-19-Pandemie eine große Rolle. Auch die Registrierung 
neuer SARS-CoV-2-Infektionen erfolgt oftmals zeitverzögert, da einerseits Infek- 
tions- und Meldedatum nicht übereinstimmen und andererseits das tatsächli- 
che Infektionsdatum nicht bekannt beziehungsweise nicht zu bestimmen ist. 
Um trotzdem möglichst genaue Prognosen des aktuellen Verlaufs der Krankheit 
treffen zu können, können die fehlenden Informationen bezüglich des tatsäch- 
lichen Infektionsdatums mit einem Nowcast geschätzt werden.3¢ Nur wenn 
eine genaue Prognose der aktuellen Infektionszahlen vorliegt, kann ein eindeu- 
tiger Zusammenhang zwischen Ursache, zum Beispiel einer Veranderung der 
Coronaregeln, und Wirkung, beispielsweise höheren oder niedrigeren Infekti- 
onszahlen, hergestellt werden. Das Robert Koch-Institut (RKI) schätzt daher 
fehlende Datenpunkte basierend auf den statistischen Zusammenhängen der 
verfügbaren Daten (sogenannte multiple Imputation), um den Zeitpunkt der 
Erkrankung an SARS-CoV-2 zu schätzen und das aktuelle Infektionsgeschehen 
besser beurteilen zu können.?” 

Abgesehen von medizinischen Studien sind Nowcasts der gegenwarti- 
gen Wirtschaftsleistung von großer Bedeutung und Gegenstand verschiedener 
Forschungsarbeiten. Aktuelle Veröffentlichungen untersuchen überwiegend 
Nowcasts, die in Pseudo-Echtzeit erstellt wurden. Es wird also simuliert, was ein 
Nowcast im jeweiligen Zeitraum prognostiziert hätte. Dafür werden nur Daten 
verwendet, die zum jeweiligen Prognosezeitpunkt verfügbar waren. Die erhal- 
tenen Prognosen können dann direkt mit den tatsächlichen Werten verglichen 
werden. Dabei werden verschiedene Herangehensweisen gewählt. 

In einer der neuesten Studien ermitteln Cepni/Guney/Swanson BIP- 
Nowcasts basierend auf Datensätzen ökonomischer Indikatoren des Informations- 
dienstleisters Bloombeg. Für fünf Schwellenländer (Brasilien, Indonesien, Mexiko, 
Südafrika, Türkei) werden dynamische Faktormodelle durch makroökonomische 
Unsicherheits- und Überraschungsfaktoren erweitert, die die intensiven globalen 


w 


* Lawless (1994). 

35 Höhle / An der Heiden (2014). 

36 Günther et al. (2020). 

37 An der Heiden / Hamouda (2020). 
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Verflechtungen der Volkswirtschaften abbilden.3® Die Überraschungsfaktoren be- 
stehen aus Abweichungen der Erwartungen professioneller Prognostiker von der 
Realität, die Unsicherheitsfaktoren enthalten Werte aus der Wirtschafts-, Han- 
dels- und Geldpolitik sowie Migration.3® Cepni/Guney/Swanson kommen zu dem 
Ergebnis, dass unterschwellige Unsicherheits- und Überraschungsfaktoren einen 
signifikanten vorhersagenden Inhalt für die Wachstumsprognose von Schwel- 
lenländern haben.*° Somit kann die Messung von Unsicherheit für eine genaue 
Vorhersage nützlich sein. Der RMSE ihres autoregressiven Standardmodells liegt 
je nach Land und den drei verwendeten Nowcast-Zeitpunkten zwischen 0,85 
und 2,34. Außerdem zeigen sie, dass der Prognosegehalt bei der Konstruktion der 
Schrumpfungstypfaktoren mit LASSO, adaptivem LASSO, bayesianischem LASSO 
und adaptivem bayesianischem LASSO verbessert ist (niedrigerer RMSE). 

Im Gegensatz dazu berücksichtigen Aastveit et al. Prognoseunsicherhei- 
ten als Wahrscheinlichkeitsverteilung in sogenannten Dichte-Nowcasts des 
US-amerikanischen BIP? Diese Nowcasts bestehen aus einem System von 
Brückengleichungsmodellen, Faktormodellen und vektorautoregressiven Mo- 
dellen. Dafür verwenden Aastveit et al. mehr als 100 monatliche Indikatoren 
wie Finanzmarktdaten, Verbraucherpreise und Umfragewerte von der Federal 
Reserve Bank in St. Louis. Die verschiedenen Dichte-Nowcasts werden zunächst 
zu drei Nowcasts je Modellklasse und schließlich zu einem Gesamt-Nowcast 
kombiniert. Die Prognosen werden mit jeder Datenveröffentlichung besser und 
der kombinierte Nowcast liefert gemäß dem von den Autoren verwendeten log 
score* die besten Prognosen.“ 

Nowcasts des BIP in der Eurozone im Jahr 2008 finden sich in Banbura/ 
Giannone/Reichlin.* Datengrundlage sind 26 „wichtige“ Indikatoren aus der 
Eurozone mit höchstens monatlicher Frequenz. Die Autoren vergleichen die 
Nowcasts eines dynamischen Faktormodells mit denen eines univariaten nai- 


38 Cepni/Guney/Swanson (2020), S. 33. 
(2020), 5.19. 
(2020), S. 32. 

4 Cepni/Guney/Swanson (2020) 

42 Aastveit et al. (2014). 


8 Der log score ist der Logarithmus einer Wahrscheinlichkeitsdichtefunktion, die an der Stelle des 
prognostizierten Ergebnisses ausgewertet wird und somit eine Maßzahl für die Passform der Dichte- 
funktion angibt. Aastveit et al. (2014), S. 51. 


44 Aastveit et al. (2014), 48 und 59. 
4 Banbura/Giannone/Reichlin (2011). 


3? Cepni/Guney/Swanson 
4° Cepni/Guney/Swanson 
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ven Random-Walk-Modells. Während das dynamische Faktormodell zu Beginn 
der Prognoseperiode einen RMSE von 0,28 aufweist, der im Laufe des Quartals 
auf 0,18 sinkt, liegt der RMSE des Random-Walk-Modells vergleichsweise kons- 
tant bei etwas über 0,30. Des Weiteren ergibt ihre Analyse, dass weiche Fakto- 
ren wie Umfrageergebnisse zu Beginn eines Quartals hohen Erklärungsgehalt 
haben. Im weiteren Verlauf des Quartals, mit der Veröffentlichung harter Fakto- 
ren, sinkt ihre Bedeutung jedoch.“ 

Banbura/Giannone/Modugno/Reichlin erstellen Nowcasts für das 
US-amerikanische BIP in Echtzeit. Dabei verwenden sie an dem Tag, an dem 
sie eine Prognose erstellen, alle bis dahin vorliegenden Daten der interessie- 
renden Variablen. Der Echtzeitdatensatz basiert auf Werten des Informations- 
dienstleisters Bloomberg und wird anhand von Daten der Federal Reserve Bank 
in St. Louis evaluiert. In diesem Paper werden sowohl gemeinsame Modelle 
— ein Faktormodell mit täglichen Daten, ein analoges Modell mit monatlicher 
Frequenz sowie ein kleines Faktormodell mit fünf „harten“ Indikatoren“ — als 
auch Brückengleichungen als Partialmodell verwendet. Die Autoren finden 
heraus, dass tagesaktuelle Finanzdaten nur einen geringen Erklärungsgehalt 
haben und stattdessen monatliche Veröffentlichungen der Werte makroökono- 
mischer Variablen entscheidend sind.“ Das Brückengleichungsmodell hat den 
höchsten RMSE zwischen 0,58 und 0,66, gefolgt von dem Modell mit den fünf 
harten Faktoren (RMSE zwischen 0,45 und 0,63). Eine noch höhere Prognosegü- 
te weist das Modell mit täglicher Frequenz auf (RMSE zwischen 0,45 und 0,60) 
und den niedrigsten RMSE zwischen 0,43 und 0,57 erzielt das Faktormodell mit 
monatlichen Daten.>° 

Abgesehen von diesen akademischen Publikationen beschäftigen sich di- 
verse Zentralbanken und (Forschungs-)Institute mit der Entwicklung eigener 
Nowcasts. Dabei bedienen sie sich sowohl herkömmlicher ökonomischer In- 
dikatoren als auch hochfrequenter Big-Data-Datensätze. Beispielsweise veröf- 
fentlicht die Federal Reserve Bank of New York ihren wöchentlich aktualisierten 


46 Banbura/Giannone/Reichlin (2011), S. 198, 205, 209 und 210. 

47 Banbura et al. (2013). 

48 Reales BIP, Industrieproduktion, verfügbares Realeinkommen, Einzelhandelsumsatz und Beschäf- 
tigung. 

49 Banbura et al. (2013), S. 214 sowie 218-219. 

5° Banbura et al. (2013), S. 217. 
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New York Fed Staff Nowcast°! zur Entwicklung des BIP in den USA.* Bei die- 
ser Prognose verwendet sie ein dynamisches Faktormodell.5® Abbildung 1 zeigt 
zwischen Januar 2019 und Dezember 2020 den Verlauf der Nowcasts gegenüber 
den tatsächlichen BIP-Werten, die ein paar Wochen nach Ablauf des jeweiligen 
Quartals veröffentlicht werden. Bereits vor Ende des ersten Quartals 2020 weist 
der Nowcast eine Abwärtstendenz auf, die sich nach Veröffentlichung der tat- 
sächlichen BIP-Entwicklung und dem Fortschreiten der COVID-19-Pandemie 
deutlich verstärkt. Das zweite Quartal 2020 wird durch den Nowcast ziemlich 
gut vorhergesagt, insbesondere in Anbetracht der sehr unsicheren Lage. Die 
Erholung im dritten Quartal 2020 wurde deutlich niedriger prognostiziert als 
sie tatsächlich ausgefallen ist. Die Prognose für das vierte Quartal ist im positi- 
ven, einstelligen Bereich. Die New Yorker Zentralbank erwartet für das Ende des 
Jahres ein BIP-Wachstum zwischen 2 und 5 %. Das tatsächliche BIP-Wachstum 
gemäß BEA wurde erst nach dem Druck dieses Artikels veröffentlicht. Es bleibt 
festzuhalten, dass der Nowcast der New Yorker Zentralbank auch im sehr unru- 
higen Jahr 2020 gute Ergebnisse geliefert hat. 

Auch die Federal Reserve Bank of Atlanta prognostiziert mit ihrem GDP- 
Now Nowcast anhand von Brückengleichungen das US-amerikanische BIP. 
Dabei werden die ersten Schätzungen des aktuellen Quartals ungefähr einen 
Monat nach Ablauf des vorherigen Quartals erstellt.54 Die out of sample Prog- 
nosegüte des GDPNow-Modells einen Tag vor der Veröffentlichung der ersten 
BIP-Schätzung liegt bei einem RMSE von 1,15. 85 Tage vor der Veröffentlichung 
liegt er noch bei durchschnittlich 2,2.55 

Für die EU und die Eurozone veröffentlicht Eurostat seit 2016 BIP-Schnell- 
schätzungen 30 Tage (t + 30) nach Quartalsende.56 Diese Prognose besteht aus 
den jeweiligen t+30 Prognosen verschiedener Mitgliedsländer sowie von 
Eurostat angefertigten Schätzungen des BIP-Wachstums der Länder mit fehlen- 
den Daten. Für diese werden mit Hilfe der Daten für die ersten beiden Monate 
des Quartals mehrere Nowcasts angefertigt. Darin werden normalerweise die 
Wachstumsraten des Industrieproduktionsindex, des deflationierten Einzel- 


Abrufbar unter https://www.newyorkfed.org/research/policy/nowcast.html. 
52 Bok et al. (2018), S. 616. 

°3 Federal Reserve Bank of New York (2019), S. 69. 

54 Federal Reserve Bank of Atlanta (2020). 

> Higgins (2014, 25 und 28). 

56 Eurostat (2019). 
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handels und des Umsatzes von Dienstleistungen anhand der Gewichtungen 
der volkswirtschaftlichen Gesamtrechnung des jeweiligen Landes verarbeitet. 
Anhand dieser Indikatoren sowie von vergangenen BIP-Werten und des Indika- 
tors für die wirtschaftliche Stimmung werden dann autoregressive Modelle mit 
verteilter Verzögerung (autoregressive distributed lag [ADL]) oder Modelle auto- 
regressiver integrierter gleitender Mittelwerte mit exogenen Variablen (auto- 
regressive integrated moving average with exogenous variables [ARIMAX]) geschätzt. 
Dieses Ergebnis geht mit in die Prognose fiir die gesamte EU beziehungsweise 
Eurozone ein.’ Der RMSE für die Quartalsschatzung für den Zeitraum 2012 bis 
2015 liegt in der EU bei 0,06 bis 0,08. In der Eurozone ist er minimal höher (0,07 
bis 0,10).58 Dieser Wert ist allerdings nur schwer mit den anderen vergleichbar, 
da es sich um eine Aggregation verschiedener Modellprognosen der einzelnen 
Länder handelt und somit kein eindeutiges Modell zugrunde liegt. 

Viele große europäische Länder wie Frankreich, Italien, Spanien, Belgien 
und Österreich veröffentlichen diese frühe Eurostat-Schätzung ihres BIP be- 
reits.°9 Für Deutschland publiziert das statistische Bundesamt seit dem zwei- 
ten Quartal 2020 eine BIP-Flash-Schnellschätzung, die ebenfalls 30 Tage (t + 30) 
nach Ablauf des Quartals zur Verfügung steht. Außerdem arbeitet es intern an 
einem BIP-Nowcast, der bereits zehn Tage (t + 10) nach Quartalsende erste Pro- 
gnosen liefern konnte.®° Das betreffende Verfahren beruht auf Modellen auto- 
regressiver integrierter gleitender Mittelwerte (ARIMA).sı Während der BIP- 
Flash t+ 30 qualitativ sehr hochwertige Ergebnisse liefert, ist der BIP-Nowcast 
t + 10 zwar vielversprechend, aber noch deutlich anfälliger für Ungenauigkeit.® 

Im November 2020 gab auch das ifo Institut bekannt, in Zukunft seine 
BIP-Schnellschätzung ifoCAST regelmäßig zusammen mit der Konjunkturpro- 
gnose zu veröffentlichen. Für diesen Nowcast wurden zunächst aus über 300 
Indikatoren mittels ML die passendsten ausgewählt. Anhand dieser wird zwei- 
mal monatlich ein dynamisches Faktormodell mit bayesianischen Methoden 
für das aktuelle Quartal geschätzt. Das neue Quartal wird ab Veröffentlichung 
der detaillierten Ergebnisse der Volkswirtschaftlichen Gesamtrechnung des 
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Vorquartals geschätzt — also ab 55 Tagen nach Quartalsende. Die Prognosegüte 
des ifoCAST ist mit einem RMSE von 0,32 recht gut.® 

Abgesehen davon entwickelt die Deutsche Bundesbank einen wöchentli- 
chen Aktivitätsindex, mit dem sich die realwirtschaftliche Aktivität in Deutsch- 
land mit geringstmöglicher Zeitverzögerung bestimmen lässt. Er wird anhand 
eines Expectation-Maximization-Algorithmus berechnet und setzt sich aus hoch- 
frequenten Indikatoren mit hohem Erklärungsgehalt aus den verschiedenen 
Wirtschaftsbereichen sowie dem BIP des vergangenen Quartals und der monat- 
lichen Industrieproduktion zusammen. Aktuelle Werte sind bei der Deutschen 
Bundesbank online abrufbar. 

Insgesamt werden für Nowcasts viele verschiedene Indikatoren verwen- 
det. Zumeist liegt den Prognosen eine ganze Reihe von Kennzahlen bezüglich 
Leistungsbilanz, Beschäftigung, Finanzmärkten, Produktion und Konsum sowie 
unterschiedliche Umfragen zugrunde. Ein tiefergehender Vergleich der jeweils 
genutzten Kennzahlen würde den Umfang dieser Arbeit überschreiten und ist 
für einen ersten Überblick über verschiedene Nowcasting-Verfahren nicht ent- 
scheidend. 


Big Data und Maschinelles Lernen 


Auf Big Data basierende Datensätze wecken seit ein paar Jahren auch verstärkt 
das Interesse von Ökonom innen. Verschiedene Studien zeigen, dass mit Big Data 
erstellte Prognosen besser als die herkömmlichen Prognosen sind, beispielswei- 
se bei der Vorhersage des privaten Konsums® oder des BIP-Wachstums.® Dabei 
unterscheidet sich Big Data von herkömmlichen Daten durch enormes Volu- 
men, hohe Geschwindigkeit, große Vielfalt, geringe Richtigkeit (im Sinne von 
Unsicherheiten in den Daten) und hohen Wert der Daten.®* In anderen Worten 
stellt Big Data jenes Informationsgut dar, das durch sein großes Volumen sowie 


63 Lehmann/Reif/Wollmershäuser (2020), S. 31-32 und 38. 
64 Deutsche Bundesbank (2020). 


65 Abrufbar unter https://www.bundesbank.de/de/statistiken/konjunktur-und-preise/woechen 
tlicher-aktivitaetsindex. 
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seine große Geschwindigkeit und Vielfalt spezielle Technologien und analyti- 
sche Verfahren erfordert, um es in (ökonomischen) Wert zu verwandeln.®? 7° 
Dies liegt darin begründet, dass diese Daten unstrukturierter sind und höhere 
Dimensionen aufweisen, sodass das Ordnen der Daten und das Reduzieren der 
Dimensionen sehr komplex ist.”! Daher ist die Nutzung von Big Data in vielerlei 
Hinsicht nicht mit der Nutzung herkömmlicher Daten vergleichbar. 

Moderne Big-Data-Datensätze sind häufig in Echtzeit verfügbar und es 
gibt Daten zu vielen neuen Bereichen.” Ihre wichtigste Quelle sind im Inter- 
net erzeugte Daten. Dabei sind insbesondere Social-Media-Daten von gro- 
Ber Bedeutung.” Darüber hinaus kann Big Data auch aus Finanzmarktdaten, 
E-Commerce- und Scannerdaten, Mobilfunkdaten, Geolokalisierungsdaten, 
Such-(maschinen-)daten, Text- und Mediendaten, sensorischen Daten oder 
Transportdaten bestehen.”4 Praktisch jede elektronisch erfasste Handlung kann 
als Datengrundlage verwendet werden, was eine Fülle von Möglichkeiten für 
tagesaktuelle Prognosen eröffnet. 

Aufgrund der besonderen Eigenschaften aktueller (Big-Data-)Datenströ- 
me, wie deren Größe und Komplexität, sollten für die Analyse von Big Data 
andere Methoden als die klassischen statistischen Verfahren verwendet wer- 
den.”® Da herkömmliche Verfahren Daten in ein Modell einpassen, das den Zu- 
sammenhang zwischen Dateneingabe und -ausgabe möglichst gut beschreibt, 
kann das jeweilige Modell nicht besser sein als der angenommene Zusammen- 
hang zwischen den Variablen selbst.’ Die großen Datensätze ermöglichen je- 
doch flexiblere Beziehungen als einfache lineare Modelle. Diese können durch 
Techniken des maschinellen Lernens effektiv modelliert werden.” Bei diesen 
Verfahren muss keine Annahme über die funktionelle Beziehung der Variab- 
len getroffen werden, sondern ein Algorithmus bestimmt die Funktion, die den 


69 „Big Data represents the Information assets characterized by such a High Volume, Velocity and 
Variety to require specific Technology and Analytical Methods for its transformation into Value.” 
Mauro/Greco/Grimaldi (2015), S. 103. 
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Zusammenhang zwischen den Variablen am besten darstellt.”® Anstelle einer 
linearen oder logistischen Regression erweisen sich nicht-lineare Verfahren wie 
Klassifikations- und Regressionsbäume, Random Forests oder bestrafte Regres- 
sionen (penalized regressions) wie LASSO, LARS und elastische Netze als besser 
geeignet.’? 

Das Vorgehen beim MLbesteht aus zwei Elementen: (1) einer Lernmethode, 
bei der anhand von Daten die bestmögliche Einpassung der Inputvariablen be- 
stimmt wird, und (2) einem Algorithmus, der die Beziehung zwischen Input und 
Output modelliert®°. Eine Besonderheit des ML ist dabei der Fokus auf die Daten 
anstelle von Theorie. Bei diesem Verfahren kann also mit einem measurement 
without theory nur auf Grundlage von Daten die Veränderung makroökonomi- 
scher Kennzahlen prognostiziert werden. Anschließend kann ML dann im Prin- 
zip auch auf die zugrundeliegende Theorie schließen. Dies geschieht indem ba- 
sierend auf den Ergebnissen der Algorithmen die richtige beziehungsweise best 
passende Theorie gesucht wird. Da mit Systemen des ML mehr und verschie- 
denartigere Informationen verarbeitet werden können, kann die Realität besser 
abgebildet und können somit potenziell bessere Prognosen erstellt werden.8? 

Allerdings kann bei der Anwendung mit Big Data die Vielzahl an vorhan- 
denen Informationen zu einem sogenannten overfitting führen. Dabei werden 
Modelle durch unnötig viele erklärende Variablen zu komplex. Das Ergebnis ist, 
dass das Modell mit dem vorliegenden Datensatz sehr genaue Ergebnisse lie- 
fert, bei out of sample-Schätzungen allerdings schlecht abschneidet. Dies kann 
durch Bestrafung übermäßig komplexer Modelle, eine Unterteilung des Daten- 
satzes in Training, Test und Validierung sowie eine k-fache Kreuzvalidierung®® 
umgangen werden.®4 

Aufgrund des enormen Potenzials von ML werden auch bei der Prognose 
des BIP im Zuge der Digitalisierung anstelle von herkömmlichen Verfahren ver- 
mehrt algorithmierte Computersimulationen verwendet.8 Auch der Sachver- 


78 Jung/Patnam/Ter-Martirosyan (2018), S. 4. 

79 Varian (2014), S. 6. 

8° Jung/Patnam/Ter-Martirosyan (2018), S. 7. 

81 Woloszko (2017), S. 7. 

82 Sachverständigenrat (2019), S. 54. 

83 Fur eine genauere Erklärung der Kreuzvalidierung siehe Varian (2014). 
84 Varian (2014), S. 6-7. 
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ständigenrat zur Begutachtung der gesamtwirtschaftlichen Entwicklung weist 
in seinem Jahresgutachten 2019/20 darauf hin, dass Methoden des ML eine 
potenzielle Alternative zu herkömmlichen (BIP-)Prognoseverfahren darstellen. 
Dabei sieht er insbesondere in neuronalen Netzen eine gute Alternative zu den 
herkömmlichen Brückengleichungen. Random Forests wird hingegen eine nied- 
rigere Prognosegüte zugeschrieben.8® 


Möglichkeiten und Grenzen von Nowcasts mit Big Data und 
maschinellem Lernen 


Die Verwendung der oben genannten Methoden des maschinellen Lernens 
für Nowcasts mit Big Data eröffnet eine Vielzahl von Möglichkeiten für (Echt- 
zeit-)Prognosen. Diese sind in der gegenwärtigen Literatur bisher nur wenig 
erforscht. Allerdings zeichnet sich das enorme Potenzial dieser Anwendung 
künstlicher Intelligenz immer mehr ab. Erste Ergebnisse bei der kurz- und lang- 
fristigen Prognose mit Methoden des maschinellen Lernens in verschiedenen 
Anwendungsbereichen finden sich in Campos Vazquez/Lopez-Araiza B.8’, Jung/ 
Patnam/Ter-Martirosyan®® sowie bei der Organisation für wirtschaftliche Zu- 
sammenarbeit und Entwicklung (OECD)®9. 

Campos Vazquez/Lopez-Araiza B.9° erstellen sehr moderne Nowcasts ei- 
nes anderen volkswirtschaftlichen Indikators mit Big Data und ML. Basierend 
auf Google-Trends-Daten prognostizieren sie mit Nowcasts die Arbeitslosigkeit 
in Mexiko. Dabei vergleichen sie den Vorhersagefehler verschiedener Modelle 
des ML. Den niedrigsten RMSE weist das LASSO-Verfahren auf (0,28). Es wurde 
mit kubischen Wechselwirkungen trainiert und kann sich deutlich besser an 
Situationen anpassen, in denen sich die Beziehung zwischen den Variablen un- 
gewöhnlich verhält.?! Das LASSO-Verfahren erzielt eine etwas höhere Prognose- 
güte als das herkömmliche autoregressive Modell. Des Weiteren verbessert die 
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Verwendung der Google-Trends??-Daten die Prognosen.?? Der RMSE des AR-Mo- 
dells mit Google Trends liegt bei 0,29 im Vergleich mit 0,31 ohne.94 

Jung/Patnam/Ter-Martirosyan® testen die Prognosegüte von BIP-Fo- 
recasts für sechs verschiedene Länder für drei Methoden des ML: elastisches 
Netz, Super Lerner und rekurrentes neuronales Netzwerk. Dabei erstellen sie 
BIP-Prognosen für ein Quartal beziehungsweise ein Jahr im Voraus. Bei der 
Quartalsprognose ohne Weltwirtschaftskrisenzeitraum, von 2010 bis 2016, 
schneiden die ML-Verfahren elastisches Netz und Super Lerner besser ab als die 
Prognosen des Weltwirtschaftsausblicks (world economic outlook [WEO]) des In- 
ternationalen Währungsfonds (IWF). Für die Quartalsprognose mit Krisenzeit- 
raum (2007 bis 2016), wird das jeweils beste ML-Modell je Land dem WEO-Mo- 
dell, dem AR-Modell sowie dem VAR-Modell gegenübergestellt. Der RMSE ist für 
alle Länder bei Prognose mit ML am niedrigsten und liegt zwischen 0,20 und 
0,81. Im Fall des VAR-Modells liegt der RMSE zwischen 1,09 und 2,20, im Fall des 
AR-Modells zwischen 0,80 und 1,52 und bezogen auf das WEO-Modell zwischen 
1,11 und 2,20 — je nach Land. Die Prognose für ein Jahr im Voraus erzielt deutlich 
schlechtere Ergebnisse und ist nurteilweise besser als die IWF-Standardprogno- 
se.96 Allgemein sind Jung/Patnam/Ter-Martirosyan der Überzeugung, dass mit 
ML erstellte Prognosen Expertenprognosen nicht ersetzen, sondern viel mehr 
als zusätzliche Hilfestellung für die finale Prognose dienen sollten.?” 

Die OECD erstellt Vorhersagen des BIP-Wachstums der G6-Länder®® in 
Pseudo-Echtzeit mit adaptiven Bäumen. Die Prognosen anhand dieses Verfah- 
rens liefern bessere Ergebnisse als Standardmodelle wie das OECD-Indikator- 
modell oder die Konsensprognose.9°? Werte des RMSE liegen für diese Metho- 
de leider nicht vor, sondern nur die Angabe, um wie viel Prozent der RMSE im 
Vergleich mit den Standardmodellen verbessert werden konnte. Die ermittelte 


92 Google Trends ist ein täglicher beziehungsweise monatlicher Echtzeitindex, der das Abfragevo- 
lumen von Google-Nutzern erfasst. 
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Verbesserung der Prognosegüte liegt bei 12 bis 23 % in Bezug auf das Indikator- 
modell und durchschnittlich bei 32 % für die Konsensprognose.1°° 

Die beschriebenen Arbeiten deuten an, welch weitreichende Moglichkei- 
ten sich fur Nowcasts mit Big Data und ML bieten. Dennoch ergibt die Analy- 
se der in diesem Beitrag beleuchteten Studien relativ große Schwankungen in 
der Prognosegüte der einzelnen Modelle. Dabei bleibt festzuhalten, dass es sich 
hierbei um keinen vollumfänglichen Vergleich der verschiedenen Verfahren 
handelt, da dieser Bereich noch nicht in ausreichendem Umfang untersucht 
wurde und die Studien aufgrund unterschiedlicher Datengrundlagen nur ein- 
geschränkt vergleichbar sind. Stattdessen werden unterschiedliche Ansätze 
anhand von exemplarischen Studien einander gegenübergestellt, um einen 
ersten Eindruck von der Güte der Prognosen zu erhalten. Den höchsten Wert 
der mittleren Fehlerquadratsumme weisen in dieser Übersicht das VAR-Mo- 
dell, ein AR-Modell sowie das Brückengleichungsmodell des GDPNow auf. Der 
RMSE dieser Verfahren kann oberhalb des Wertes zwei liegen. Deutlich niedri- 
gere Werte ergeben das ML-Modell von Jung/Patnam/Ter-Martirosyan!! sowie 
das Brückengleichungsmodell und das dynamische Faktormodell von Banbura/ 
Giannone/Modugno/Reichlin!©? mit Werten unter eins. Den niedrigsten RMSE 
erzielen Campos Väzquez/Löpez-Araiza B.!% mit der LASSO-Methode und mit 
der Random-Forest-Schätzung sowie Banbura/Giannone/Reichlin!™ mit einem 
dynamischen Faktormodell. Alle drei RMSE sind niedriger als 0,3. 

Die teilweise großen Unterschiede zwischen den jeweiligen RMSE inner- 
halb einer Studie lassen sich bei Vergleichen verschiedener Länder vermutlich 
auf die länderspezifischen Unterschiede hinsichtlich der Volatilität der Daten 
und der Zahl der Beobachtungen zurückführen. Bei mehreren Prognosen für 
das gleiche Land ergeben sich Unterschiede im RMSE durch das Hinzukommen 
von Informationen für die jeweilige prognostizierte Periode, beispielsweise das 
Quartal oder Jahr, im Zeitablauf, was die Prognose verbessert. 


100 Woloszko (2017), S. 23 und 25. 

101 Jung/Patnam/Ter-Martirosyan (2018). 
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Tab.1: RMSE verschiedener Prognosemodell 


MODELL RMSE QUELLE 
Autoregressives Mode 0,85 — 2,34 Cepni et al. (2020) 
Autoregressives Mode 0,80 —1,52* ung et al. (2018) 
Autoregressives Mode 0,29 — 0,31 Campos Vazquez/Lopez-Araiza B. (2020) 
Vektorautoregressives Mode 1,09 — 2,20* ung et al. (2018) 
Brückengleichungsmode 0,58 — 0,66 Banbura et al. (2013) 
Brückengleichungsmodell (GDPNow) 115—2,2 Higgins (2014) 
Dynamisches Faktormode 0,18 — 0,28 Banbura et al. (2011) 
Dynamisches Faktormode 0,43 — 0,57 Banbura et al. (2013) 
Dynamisches Faktormodell (ifoCAST) 0,32 Lehmann et al. (2020) 
Bestes ML-Mode 0,20 — 0,81* ung et al. (2018) 
LASSO 0,28 Campos Vazquez/Lopez-Araiza B. (2020) 
Random Forest 0,29 Campos Vazquez/Lopez-Araiza B. (2020) 


RMSE = root mean square error (Wurzel der mittleren Fehlerquadratsumme) 
* Werte beziehen sich auf Quartalsprognose mit Krisenzeitraum (2007 bis 2016) 
Quelle: Eigene Darstellung. 


Weitere potenzielle Frühindikatoren, die sich aus bisher kaum genutzten Daten- 
sätzen diverser Aktivitäten ableiten lassen, werden vom Statistischen Bundesamt 
untersucht. Beispielsweise kann mit Mobilfunkdaten die Mobilität der Bevölke- 
rung dargestellt werden. Im Zuge der COVID-19-Pandemie wurden so allgemeine 
Unterschiede im Pendlerverhalten erkannt. Ein solcher Näherungswert kann als 
tagesaktueller Index der konjunkturellen Aktivität in bestimmten Gebieten ver- 
wendet werden. Als frühzeitige Umsatzprognose eignet sich die Auswertung von 
Umsatzsteuervoranmeldungen. Des Weiteren kann mit Daten zu Onlinetransak- 
tionen sowie neuen Hypotheken- und Kreditverträgen die Aktivität im Online- 
handel, bei Hauskäufen oder beim privaten Konsum abgebildet werden.!05 

Zur frühzeitigen Prognose von Verbraucherpreisen können Scannerdaten 
aus dem Einzelhandel herangezogen werden. Sie enthalten Informationen über 
Art, Absatz und Umsatz verkaufter Artikel und werden an der Kasse erfasst. Dabei 
kann auch die Nachfrage nach bestimmten Produktgruppen analysiert werden. 
Außerdem kann man daraus die gegenwärtige wirtschaftliche Lage des Einzel- 
handels ableiten. Des Weiteren können Satellitendaten zur Bestimmung der wirt- 
schaftlichen Aktivität herangezogen werden, zum Beispiel zum Aufkommen an 
Schiffen auf dem Meer oder von Autos vor einem Geschäft.!0 Als Fruhindikator 
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für die Industrieproduktion in Deutschland kann ein an Arbeitstagen aktualisier- 
ter Lkw-Maut-Fahrleistungsindex verwendet werden. Die Fahrleistung großer 
Lkw kann damit mit fünf bis neuntägigem Abstand ziemlich genau erfasst wer- 
den.107 

Eine weitere potenzielle Quelle von Big Data für ökonomische Analysen 
sind Textdaten. Ähnlich wie in den Beiträgen von Silke Sturm sowie von Deniz 
Dilan Karaman Orsal in diesem Band beschrieben, können Textdaten aus den 
Sozialen Medien automatisiert ausgewertet werden und als weiterer, sehr kurz- 
fristiger Faktor in Nowcasts einfließen. Erste Erfahrungen im Bereich der Poli- 
tikanalyse sowie bei der Prognose von Kaufverhalten deuten auf eine hohe Ge- 
nauigkeit dieses Verfahrens hin. Manche Forscher:innen gehen sogar so weit zu 
sagen, dass Wörter die neuen Zahlen sind.1°8 Mehr Informationen zur Verwen- 
dung von Textdaten aus Zeitungen für die Konjunkturanalyse mit Nowcasts fin- 
den sich auch in Thorsrud?°?. 

Mit der Nutzung von Big Data, den Methoden des ML sowie dem Nowcast 
selbst gehen einige Probleme einher. Beispielsweise verlangt die große Ge- 
schwindigkeit von Big Data eine Vielzahl notwendiger Reaktionen. Diese 
schnellen Reaktionen erfordern im Gegenzug enorme Ressourcen für die zeit- 
nahe Sammlung, Speicherung und Verarbeitung der Daten. Außerdem können 
sowohl die Ungenauigkeit als auch die Verschiedenartigkeit der Daten und die 
damit einhergehende Komplexität teilweise nicht ohne Weiteres bewältigt 
werden." So liegen viele Probleme mit Big Data in den hohen Anforderungen 
begründet, die diese Datenart an Systemarchitekturen, Datenverarbeitungsrah- 
men sowie Verarbeitungsmodi stellt.™ 

Außerdem kann es bei der Vielzahl von Datenpunkten leicht passieren, 
dass ein Ergebnis nur aufgrund der Menge der Daten statistisch signifikant ist 
und nicht aufgrund eines tatsächlichen Zusammenhangs. Darüber hinaus wer- 
den mit Big Data überwiegend Korrelationen und keine Kausalitäten aufgezeigt 
(Scheinkorrelationen). Auch das Auswerten von Daten ohne zugrunde liegende 
Theorie, die die Ergebnisse erklären könnte, kann zu Problemen führen.!!? Des- 
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10 Jin et al. (2015), 5.59 und 62. 
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wegen bezweifeln Okonom:innen häufig die Zuverlässigkeit und die Reprasen- 
tativität von Big Data.!!3 

Aus unternehmerischer Sicht gibt es zwei weitere Herausforderungen. Ei- 
nerseits existiert eine Kluft zwischen Unternehmen, die über viele Daten verfü- 
gen, zum Beispiel Social-Media-Plattformen, und solchen, die kaum Zugriff auf 
Daten haben. Andererseits müssen Unternehmen über entsprechende Techno- 
logien und Fertigkeiten im Umgang mit Big Data verfügen, um wettbewerbsfä- 
hig zu sein.14 

Bezüglich des MList es problematisch, dass diese Verfahren oft nicht ohne 
Weiteres erklären können, welche Faktoren zu der Prognose geführt haben, weil 
der Analyse kein spezielles Modell zugrunde liegt. Deswegen sind die mit Me- 
thoden des ML erlangten Ergebnisse nur schwer nachvollziehbar und interpre- 
tierbar und bleiben häufig sozusagen in einer Black Box.15 

Um langfristig als zuverlässige Konjunkturprognose anerkannt zu wer- 
den, müssen Nowcasts, die auf Big Data und ML-Methoden basieren, bestimmte 
Kriterien erfüllen. Laut Deutscher Bundesbank ist die Prognosegüte dabei der 
wichtigste Faktor, also die Frage, wie genau das jeweilige Modell eine relevante 
Zielvariable voraussagen kann. Außerdem sollte das Modell möglichst geringen 
Schwankungen unterliegen, um die Interpretation und Kommunikation aktuel- 
ler Ergebnisse zu erleichtern. Darüber hinaus ist jedoch auch relevant, dass das 
Ergebnis mit Hilfe des Modells nachvollzogen werden kann.!!$ Dies gestaltet 
sich, wie oben beschrieben, bei Verfahren des ML häufig schwierig. Abgesehen 
davon ist die frühzeitige Prognose von Trendwenden immens wichtig. Da dies 
nicht so leicht zu erreichen ist, sollte das Augenmerk auch auf die Vorhersa- 
ge solcher Wendungen gelegt werden. Weitere Probleme beim ökonomischen 
Nowcasting, wie mögliche Messfehler, werden in Castle et al." beleuchtet. 

Überdies gilt es, auch ethische und datenschutzrechtliche Erwägungen 
zu berücksichtigen. Ungeachtet der Vorteile der Big-Data-Analyse kann es aus 
ethischer Sicht ungünstig sein, dass sowohl in der Gegenwart als auch in der 
Zukunft der freie Wille nicht geschützt ist, da mit großen Datenmengen gegen- 


"3 Taylor/Schroeder/Meyer (2014), 5.1. 

4 Mauro/Greco/Grimaldi (2015), S. 100-101. 
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wärtiges Verhalten untersucht und zukünftiges Verhalten prognostiziert und 
damit auch für manipulative Zwecke instrumentalisierbar wird."!8 

Außerdem ist aus datenschutzrechtlichen Gründen der Zugriff auf inter- 
essante Datensätze nur eingeschränkt möglich. Häufig werden Daten nur dort 
ausgewertet, wo sie gesammelt werden. Beispielsweise wird der Lkw-Maut-Fahr- 
leistungsindex vom Bundesamt für Güterverkehr erstellt. Kooperationen mit an- 
deren Einrichtungen wie dem Statistischen Bundesamt werden ebenfalls durch- 
geführt. Allerdings ist es nur schwer vorstellbar, dass solche Daten in Deutschland 
kurzfristig einer Vielzahl von Forscher:innen zur Verfügung gestellt werden. Auch 
Verwaltungsdaten sind hochinteressant für die Wirtschaftsforschung. Allerdings 
ist der Zugriff auf diese Daten je nach Land sehr umstandlich.1 Daten aus dem 
privaten Sektor können beispielsweise durch Kollaborationen mit privaten Fir- 
men analysiert werden.!2° Abgesehen davon sind Verfügbarkeit und Zugriff auf 
Daten europaweit sehr unterschiedlich geregelt,” sodass Big-Data-Prognosen 
unter Berücksichtigung der jeweiligen länderspezifischen gesetzlichen Regelun- 
gen erfolgen müssen. Dennoch sind die mit solchen Datensammlungen mach- 
baren Prognosen voller Potenzial und von großer Bedeutung für zukünftige Kon- 
junkturvorhersagen. 


Schlussfolgerungen 


Konventionelle Methoden zur Vorhersage der Konjunkturentwicklung reichen 
nicht mehr aus, da sie Veränderungen und Wandel nicht genau genug abbilden 
und Trendwenden nicht frühzeitig genug erkennen. Wissenschaft und auch Ge- 
sellschaft verlangen nach neuen, besseren Prognoseverfahren. Dieser Beitrag 
hat gezeigt, dass es neue Möglichkeiten der Konjunkturprognose gibt, gerade 
auch durch, mit und dank der Datenökonomie. 

Eine in der gegenwärtigen Literatur vieldiskutierte Alternative zu traditi- 
onellen Forecasts sind hochaktuelle Nowcasts, die, wenn sie auf hochfrequen- 
ten Daten beruhen, quasi in Echtzeit Informationen lesen und zu Prognosen 
der Gegenwart verarbeiten können. Verschiedene Verfahren verweisen auf die 
schier unendlichen Möglichkeiten der Kombination von Big Data und ML mit 


"18 Mauro/Greco/Grimaldi (2015), S. 100. 
"9 Einav/Levin (2014b), S. 2-3. 
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Nowcasts. Im Allgemeinen zeichnet sich bei diesem Ansatz eine Tendenz zu er- 
höhter Prognosegüte gegenüber herkömmlichen Verfahren ab. 

Momentan steht die Wissenschaft noch am Anfang dieser neuartigen 
Entwicklungen. Trotz der genannten Limitationen wird weiter an der Entwick- 
lung von Nowcasts entscheidender makroökonomischer Variablen wie des BIP 
gearbeitet werden, da die Kenntnis der gegenwärtigen Konjunktur von großer 
Bedeutung ist, das Potenzial von Big Data enorm und ML für die effiziente Aus- 
wertung dieser Daten bestens geeignet ist. Der Drang nach Etablierung und 
Weiterentwicklung von Nowcasts zeigt sich beispielsweise an den enormen 
Fortschritten, die im vergangenen Jahr auf diesem Gebiet in Instituten und 
Zentralbanken gemacht wurden. Schon jetzt ermöglichen die verschiedenen 
Nowcasts einen ersten Schritt in Richtung Neuvermessung der Weltwirtschaft, 
indem Informationen zu konjunkturellen Aktivitäten (zum Beispiel das BIP) 
früher veröffentlicht werden, ohne große Einbußen an Genauigkeit hinnehmen 
zu müssen. Auf längere Sicht ist es denkbar, dass die Verfügbarkeit eines genau- 
en, aktuellen Konjunkturindikators zu einem Wettbewerbsvorteil für Unterneh- 
men, Institutionen und Länder werden kann. Wer früher als alle anderen über 
die gegenwärtigen Entwicklungen informiert ist, kann am besten auf die Wirt- 
schaft einwirken und somit Tendenzen verstärken oder frühzeitig abfangen. 

Die immense Bedeutung der riesigen Datenmengen (das heißt von Big 
Data), mit denen das Verhalten Einzelner, aber auch die Entwicklungen einer 
ganzen Volkswirtschaft relativ genau beschrieben werden können, wird immer 
deutlicher werden, auch für Nowcasts. Es zeigt sich bereits, dass die Erweiterung 
traditioneller Prognosen um diese Datenart die Genauigkeit von Vorhersagen 
erhöht. Um Big Data möglichst effizient auszuwerten, sollten insbesondere Me- 
thoden des ML zum Einsatz kommen und mit den Ergebnissen herkömmlicher 
Verfahren verglichen werden. Vieles deutet darauf hin, dass künstliche Intelli- 
genz die Zukunft mitgestalten wird. Deswegen müsste auch die Wissenschaft 
von dieser Art, Informationen zu verarbeiten, Gebrauch machen. Dabei sollte 
ML nicht vorwiegend als Konkurrenz zu etablierten Methoden betrachtet wer- 
den, sondern als Möglichkeit, bestehende Ansätze zu erweitern beziehungswei- 
se zu vertiefen. 

Damit es nicht zu ethischen Problemen kommt, muss die Auswertung von 
Big Data sehr vorsichtig und nach international festgelegten Regeln und Ge- 
setzen erfolgen. Dann bieten sich der Echtzeitprognose wichtiger Kennzahlen 
unzählige Möglichkeiten und die neue Datenökonomie kann selbst dazu beitra- 
gen, die mit ihr einhergehenden Herausforderungen zu bewältigen. 
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Textdaten 


Anwendungen und Herausforderungen 


Silke Sturm 


Einleitung 


Textdaten sind die am starksten wachsende Datenquelle. Seit zwei Jahrzehnten 
nimmt die Zahl der Haushalte mit dauerhaftem Internetzugang zu, häufig ist 
dieser durch mobile Daten zusätzlich unabhängig von ihrem Aufenthaltsort.! 
Es werden auf Seiten aller gesellschaftlichen und wirtschaftlichen Akteure Bei- 
träge verfasst, wobei sowohl redaktionell bearbeitete als auch privat verfasste 
Texte relevant sind. Durch die größere Bedeutung von Textdaten und die sich 
stetig verbessernde Rechenleistung entwickelt sich der Bereich automatisierter 
Textanalysen in vielfältigen Fachbereichen dynamisch. 

Die Nutzung einer großen Bandbreite von Veröffentlichungen hat Vortei- 
le in Form einer allgemeineren Abdeckung relevanter Themen und Meinun- 
gen und damit einer besseren Abschätzbarkeit von Entwicklungen. Allerdings 
ist durch die Varianz der Kommunikation, welche sich durch Länge, Qualität, 
Vokabular oder Menge der verschiedenen Themen unterscheidet, die Auswer- 
tung schwierig und bedarf eines präzisen Vorgehens. Das Ziel, die Chancen der 
Auswertung und das Verständnis wirtschaftlicher und politischer Zusammen- 
hänge zu verbessern, ist die treibende Kraft hinter den aktuell steigenden For- 
schungsanstrengungen.? 

Dieser Beitrag beschäftigt sich mit der automatisierten Textanalyse und 
ihren Vor- und Nachteilen. Darüber hinaus widmet er sich einer Betrachtung der 
Chancen und Herausforderungen Sozialer Medien und politisch-gesellschaftli- 


1 Kumar/Das (2013); WorldBank (2019). 
2 Einav/Levin (2014). 
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cher Texte. Die Anwendbarkeit unstrukturierter Textdaten fur Forschungsinter- 
essen wird anhand eines exemplarischen Auszugs aus der politischen Diskussi- 
on in der Legislaturperiode 2014 bis 2017 dargestellt. 


Texte als Daten 
Vor- und Nachteile textbasierter Daten 


Der Vorteil strukturierter Daten in Form von Statistiken, Surveys, tabellarischen 
Aufstellungen oder weiteren quantitativen Erhebungen ist naheliegend. Die 
Daten liegen bereits in maschinenlesbarer Form vor, konnen ohne umfangrei- 
che Vorbereitungen genutzt werden und sind weitestgehend vergleichbar. Sta- 
tistiken ökonomisch und gesellschaftlich relevanter Daten liegen zum Teil in 
Aggregaten oder mit Zeitverzug vor. Insbesondere makroökonomische Variab- 
len wie zum Beispiel Wachstum, Inflation, Konsum oder Arbeitslosigkeit stehen 
erst mit zeitlichem Verzug, also als Spätindikatoren zur Verfügung.’ Es können 
demnach erst ex-post Veränderungen beziehungsweise vergangene Entwick- 
lungen beobachtet werden. Zur Prognose zukünftiger Entwicklungen werden 
Forecasts über vorauslaufende Indikatoren wie zum Beispiel Börsenkurs, Bau- 
aktivitaten oder Kredite genutzt.* 

Um Verzögerungen auszugleichen, werden, etwa im Bereich des Konsu- 
mentenverhaltens, aufwendige Befragungen durchgeführt. Diese geben teil- 
weise einen Ex-ante-Eindruck der Verhaltensentwicklung, sind dabei allerdings 
sehr aufwendig.’ 

Strukturierte, quantitative Daten bilden nur einen kleinen Teil der Realität 
und der tatsächlich zur Verfügung stehenden Daten ab. Durch die allgemeine 
Verfügbarkeit des Internets wird davon ausgegangen, dass weltweit bis zu 90 % 
der generierten Daten in unstrukturierter Form vorliegen. Diese Daten um- 
fassen Text- und Bilddaten aus den verschiedensten Zusammenhängen. Dabei 
sind Text- und Bilddaten nicht nur für makroökonomische Prognosen relevant, 
sondern fallen auch in politischen, gesellschaftlichen und unternehmerischen 


? lyetomiet al. (2020). 
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Kontexten in großen Mengen an. Big Data stellt eine große Chance fur die For- 
schung und politische Entscheidungstrager dar, stellt sie aber auch vor die He- 
rausforderung, die Daten aufwendig zu analysieren, Datenschutzrichtlinien zu 
beachten und eine Reproduzierbarkeit der Ergebnisse sicherzustellen. 
Textdaten sind insbesondere auch in der ökonomischen Forschung von Be- 
deutung. Die Daten werden durch verschiedene Akteure in gesellschaftlichen, 
sozialen und geschäftlichen Beziehungen generiert. Historische Daten sind vor- 
nehmlich offizieller oder redaktioneller Natur, darunter fallen offizielle Reden, 
journalistische Beiträge, Pressemitteilungen oder Interviews. Durch Soziale 
Netzwerke, persönliche Blogs oder Websites und Kommentarspalten bilden in- 
formelle Informationen einen wachsenden Anteil an der gesamten Datenbasis. 
Zusätzlich haben sich die Menge der Informationen über einzelne Individuen 
und deren Aussagekraft für ökonomische und (wirtschafts-)politische Kontexte 
erhöht.” 
Zusammengefasst bestehen drei elementare Vorteile der Verwendung 
textbasierter Daten: 
- Die Daten sind ad hoc verfügbar. Es besteht kein Zeitverzug zwischen der 
Generierung der Daten und ihrer Verwertbarkeit.® 
- Soziale Medien wie Twitter und Facebook oder Google-Anfragen stellen oft 
Meinungsäußerungen bewusster oder unbewusster Natur dar.? 
- Textbasierte Daten sind kostengünstiger als Surveys. 


Die zeitgenaue Verfügbarkeit der Daten ist im Vergleich mit traditionellen Sta- 
tistiken als einer der größten Vorteile zu betrachten. Während für die Verarbei- 
tung und Berechnung von Indizes Daten aus verschiedenen Quellen verarbeitet 
werden müssen und zum Teil erst verspätet zur Verfügung gestellt werden, sind 
Textdaten mit ihrer Veröffentlichung rascher verfügbar. Je nach Analysemetho- 
de können die Daten damit zeitnah Aufschluss über Veränderungen der Mei- 
nung oder der ökonomischen Aktivität liefern. Zusätzlich sind durch Mitteilun- 
gen in den Sozialen Medien unmittelbare Äußerungen der Akteure verfügbar. 
Über unmittelbare Meinungsäußerungen können Entwicklungen nicht nur 
zeitnah nachverfolgt, sondern auch vorhergesagt werden. Intensiv hat sich die 
Forschung unter anderem zur Entwicklung des Finanzmarkts nach Äußerun- 


7 Hu/Liu (2012). 
8 Ebenda; Sakaki/Okazaki/Matsuo (2010). 
>? Ravi/Ravi (2015). 
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gen der Zentralbanken entwickelt und kommt zu sehr guten Ergebnissen. Der 
Forschungsstrang nutzt Sentiments, um zum Beispiel Entwicklungen auf dem 
Aktienmarkt zu prognostizieren.!° Diese Methodik kann entsprechend auch auf 
Mitteilungen von Konsumenten/Parteien/Wählern angewandt werden, um 
Verhalten und Entwicklungen vorauszusagen. Die Analysemethoden erlauben 
zusätzlich die Analyse impliziter Inhalte wie zum Beispiel psychologischen Mo- 
tiven oder Sentiments. Durch die Nutzung impliziter Inhalte werden die unmit- 
telbaren Äußerungen von in-(offiziellen) Akteuren noch besser interpretierbar. 

Die Verwendung von Textdaten erfordert umfangreiche Vorbereitun- 
gen der Dokumente, die Vorteile der Textdaten müssen den Kosten und dem 
Aufwand der Auswertung gegenübergestellt werden. Als Dokumente/Textab- 
schnitte zählen dabei einzelne abgeschlossene Texteinheiten, die für die späte- 
re Analysemethode verwendet werden. Je nach verwandter Methodik können 
dies gesamte Dokumente, Sätze oder Wortgruppen sein. Die Vorbereitung der 
Textdaten ist wesentlich umfangreicher und zeitaufwendiger als die Vorberei- 
tung von Daten im Rahmen offizieller Statistiken." 

Ein weiterer kritischer Aspekt der computerbasierten Textanalyse ist die 
Reproduzierbarkeit der Ergebnisse. Computerbasierte Textanalyse greift auf Al- 
gorithmen mit festgelegten Parametern zurück oder kodiert die Daten inner- 
halb von überwachten Ansätzen. Die entsprechenden Parameter müssen klar 
festgehalten und dargestellt werden, um eine Reproduktion zu ermöglichen. 
Für die händische Kodierung sind klare Richtlinien zur Validität und zur Reli- 
abilität festgeschrieben, unüberwachte Verfahren erfordere eine ähnliche Vor- 
gehensweise. Die Handkodierung eines Subsets der Dokumente kann zum Bei- 
spiel dazu beitragen, die Ergebnisse zu validieren. 

Es gibt eine wachsende Zahl von Algorithmen zur Auswertung unstruk- 
turierter Textdaten. Eine Erfassung aller Algorithmen ist nicht möglich, sie ver- 
teilen sich auf verschiedene Fachbereiche. Die Algorithmen koexistieren und 
werden je nach Anwendung und Fachbereich eingesetzt. Die Menge der Algo- 
rithmen wächst mit den Anwendungsfeldern. Grundsätzlich wird zwischen 
überwachten und unüberwachten Analysemethoden unterschieden, hinzu 
kommen Methoden wie Regressionsanalysen, Inhaltsanalysen oder Natural 
Language Processing (NLP). 


1° Tetlock (2007); Bollen/Mao/Zeng (2011). 
"  Gentzkow/Kelly/Taddy (2019). 
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Da in der ökonomischen Literatur die letztgenannten Methoden nur geringe 
Anwendung finden, sind sie fiir den vorliegenden Artikel von untergeordneter 
Relevanz. Quinn et al? haben eine Liste der Kosten und der benötigten Daten- 
grundlagen erstellt. Mit Ausnahme des Lesens von Texten und des automatisier- 
ten Topic Modelings setzen alle Methoden eine sehr gute Kenntnis der zugrun- 
deliegenden Texte voraus. Die Kosten der Praanalysephase sind somit hoch. Die 
Kodierung der Texte beziehungsweise die Erstellung eines passgenauen Worter- 
buchs oder die vollstandig handische Kodierung erfordern die Bearbeitung eines 
Anteils oder des gesamten Textbestands. In Abbildung 1 werden die wichtigsten 
Algorithmenklassen für die automatisierte Textanalyse dargestellt. Einige ausge- 
wählte Algorithmen werden in der Folge genauer vorgestellt. 


Textdaten 
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8 Learning) Learning) 
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Abb.1: Schematische Darstellung automatisierten Text Minings 
Quelle: eigene Darstellung. 
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12 Quinn et al. (2010). 


3 Fur eine umfassende Darstellung bieten sich zum Beispiel Murphy (2012), Bishop (2016) und Gent- 
zkow/Kelly/Taddy (2019) an. 
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Merkmalsextraktion 


Fur die Auswertung textbasierter Daten ist eine Reduktion der Dimension 
notwendig. Hierfür werden durch die Filterung unwichtiger Elemente charak- 
teristische Merkmale herausgefunden. Die Extraktion von Merkmalen (feature 
extraction) wird zum Beispiel durch Loschen der Interpunktion erzielt. Zusatzlich 
werden haufig sogenannte Stop Words aus dem Datensatz entfernt. Stop Words 
sind üblicherweise häufig genutzte Wörter einer Sprache, wie zum Beispiel die 
Füllwörter „und“, „weil“ oder „da“. Diese Wörter haben für die Extraktion des 
Inhaltes kaum Bedeutung, in spezifischen Kontexten kommen weitere Wörter 
hinzu. Dies können etwa Wörter sein, die zwar nur einer der zu kategorisieren- 
den Gruppen zuzuordnen sind, jedoch nicht zur Beantwortung der Forschungs- 
frage dienlich sind. Beispielsweise können Politikernamen spezifisch für eine 
Partei sein, für die Frage des Parteienfokus sind sie jedoch nicht dienlich. Die 
Nutzung von Stop Words muss für jedes Studiendesign individuell geklärt wer- 
den." 

Eine Alternative ist die Verwendung von term frequency — inverse document 
frequency-(tf-idf-)Verfahren. Damit gemeint ist die Häufigkeit eines Wortes in ei- 
nem Dokument, multipliziert mit dem logarithmierten Anteil an Dokumenten, 
die das Wort enthalten. Im Ergebnis wird ein niedriger tf-idf-Wert für sehr häu- 
fige Wörter in allen Dokumenten und sehr seltene Wörter in einem spezifischen 
Dokument ausgegeben. Anders formuliert werden als Features jene Wörter be- 
halten, die häufig in einem einzelnen Dokument vorkommen, aber selten in an- 
deren Dokumenten.!5 

Als weiterer Schritt wird ein Stemming, das heißt eine Verkürzung der 
Wörter auf ihren Wortstamm, durchgeführt. Alle beschriebenen Schritte redu- 
zieren die Menge der zu analysierenden Daten. Zwei Aspekte profitieren von 
den Vorbereitungen des Datensatzes: Zum einen werden die Ergebnisse leichter 
interpretierbar und zum anderen sinkt die notwendige Rechenleistung. 


14 Nenkova/McKeown (2012). 
3 Ebenda. 
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Uberwachte Verfahren 


Uberwachte oder Klassifizierungsmethoden bringen auf Grundlage eines Trai- 
ningsdatensets dem Modell Kriterien bei, die später für unbekannte Daten ge- 
nutzt werden können, um Vorhersagen über Inhalte oder Verhaltensweisen zu 
treffen. Dem Trainingsdatenset werden dabei Kategorisierungen zugeordnet, 
der Algorithmus lernt daraufhin die Charakteristika der Kategorien und ordnet 
sie den Kategorien zu. In einfachen Ansätzen werden hierzu etwa Kritiken mit 
einer quantifizierbaren Bewertung als Kategorisierung genutzt. Es ist demnach 
keine weitere Kodierung durch Experten notwendig (zum Beispiel Produktbe- 
wertungen)'®. 

Überwachte Methoden gelten insbesondere bei tiefgehenden inhaltlichen 
sowie psychologischen Textanalysen als präziser. Die Aussagen können vor 
dem automatisierten Verfahren ähnlich wie bei händischen Verfahren kodiert 
werden. Durch die Vorkodierung anhand theoriegeleiteter Kriterien verringert 
sich die Wahrscheinlichkeit einer fehlerhaften Zuordnung. Bei der Auswahl der 
Algorithmen sind zwei Aspekte zu beachten: Zum einen ist ein sogenanntes 
Overfitting des Modells möglich. Wenn der Algorithmus das Trainingsdatenset 
zu kleinteilig analysiert hat, kann es passieren, dass das Ergebnis auf der Ba- 
sis neuer Daten sich schlechter darstellt. Die detaillierten Charakteristika des 
Trainingsdatensets müssen nicht im neuen Datensatz vorkommen und können 
damit nicht vom Algorithmus erfasst werden.” Zum anderen werden fur über- 
wachte Methoden mehr Daten benötigt, das heißt, es werden ein ausreichend 
großes, passgenaues Trainingsdatenset und die eigentlich zu untersuchenden 
Daten benötigt.!2 

Die Trainingsmethode basiert bei den meisten Studien auf Naive Bayes, 
Entscheidungsbäumen, Support Vector Machines oder regressionsbasierten 
Klassifizierungen.!? 


16 Liu/Zhang (2012). 
7 Murphy (2012). 
18 Aggarwal (2012). 


19 Fur einen umfangreichen Überblick bieten sich Gentzkow/Kelly/Taddy (2019) und Aggarwal/Zhai 
(2012a) an. 
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Unüberwachte Verfahren 


In Bezug auf untiberwachte Verfahren wird zwischen klassischen Cluste- 
ring-Ansatzen und dem sogenanntem Soft Clustering unterschieden. Anders 
als im Falle der überwachten Verfahren benötigen die Algorithmen keine vor- 
kodierten Trainingsdaten. Aus den zur Verfügung stehenden Daten werden 
Cluster generiert, welche die Struktur der Texte widerspiegeln. Mit dem Ansatz 
können Informationen aus großen Mengen textbasierter Daten extrahiert wer- 
den. Grundsätzlich finden zwei Ansätze Verwendung: das klassisches Cluste- 
ring und das Soft Clustering. 

Beim klassischen Clustering wird die Anzahl der Cluster k definiert und 
die k Punkte werden randomisiert als Zentrum des Clusters festgelegt. Alle Be- 
standteile werden dem nächstliegenden Cluster-Zentrum zugeordnet (euclidean 
distance). Anschließend wird der Mittelwert jedes Clusters berechnet. Dieser bil- 
det sodann das Zentrum der Cluster. Die Methode ist schnell und effizient, kann 
jedoch etwa durch die präzise Wahl des initialen Zentrums erheblich verbessert 
werden. Des Weiteren ist die Anzahl der k Cluster nicht immer leicht zu bestim- 
men.?° 

Im Gegensatz zum deterministischen Ansatz des einfachen Clustering 
liegt dem probabilistischen Ansatz eine Dichteverteilung zugrunde. Soft-Clus- 
tering-Methoden (oder „Topic-Modell“) errechnen die Wahrscheinlichkeit, mit 
der ein Dokument einem Themencluster zugeordnet werden kann. Ein erster 
Versuch, probabilistische Aspekte in die Analyse zu integrieren, war die ,,pro- 
babilistic Latent Sementic Analysis“ (pLSA).24 Dieser Methode liegt kein gene- 
ratives Modell zugrunde, doch die Latent Dirichlet Allocation (LDA) eliminiert 
dieses Problem. Der Auswertung in diesem Beitrag liegt die LDA zugrunde.?? 
LDA nimmt an, dass sich jedes Dokument aus einer Mischung von Themen zu- 
sammensetzt. Jedes Thema besteht aus einer Verteilung des tiber den Datensatz 
vorhandenen Vokabulars. Der probabilistische, generative Prozess ist wie folgt 
definiert: 


20° Aggarwal/Zhai (2012b). 
21 Hofmann (2013). 
22 Blei/Ng/Jordan (2003). 
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Fur jedes Thema: 


Bk~ DirV (n) (1) 
Fur jedes Dokument: 
6, ~ Dir(a) (2) 
Fur jedes Wort: 
Zan ~ Mult(0q), with Zan € {1, ..., K} (3) 


Wan ~ Mult (Bz,,,), with Wan € {1,...,V} 


Die LDA verwendet zwei Dirichlet-Zufallsvariablen: erstens die Themen £, wel- 
che eine Verteilung über das Vokabular V (mit den Themen 1 bis K) sind, und 
zweitens die Themenzuordnung pro Dokument 6, Die Dirichlet-Verteilung 
verwendet feste Parameter 7 und a, die die Themenverteilung über Wörter be- 
ziehungsweise die Themenverteilung pro Dokument über Wörter beeinflussen. 
Die Themenzuweisung pro Wort Z,, ist die dritte verborgene Variable, welche 
die zugrunde liegende latente Struktur des Korpus definiert. W,, ist die beob- 
achtete Variable, die Informationen über das im Korpus verwendete Vokabular 
enthält. In anderen Worten liefert der Algorithmus eine Zusammenfassung 
der im Korpus enthaltenen Themen, bestehend aus dem spezifischen Vokabular 
und der Wahrscheinlichkeit, dass ein Thema einem Dokument zugeordnet wer- 
den kann. Seit den ersten Topic-Modells ist eine Vielzahl neuer Modelle mit un- 
terschiedlicher Schwerpunktsetzung, zum Beispiel Themenkorrelation?#, struk- 
turelle Topic-Modelle (STM)?5 oder dynamische Topic-Modelle?®, entstanden. 


Politische und gesellschaftliche Texte 
Direkte politische oder gesellschaftliche Kommunikation unterscheidet sich 


durch zwei Merkmale von formalen oder journalistischen Texten. Zum einen 
beinhalten die schnell verfassten, nicht redaktionell bearbeiteten Kommentare 


N 


3 Blei/Lafferty (2009). 
24 Blei/Lafferty (2007). 
2° Roberts et al. (2014). 
6 Blei/Lafferty (2006). 


N 
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ein vielseitiges Vokabular. Zum anderen steht zwischen dem Verfasser der Tex- 
te und den Lesenden kein Interpretationsschritt durch Erlauterungen, Zusam- 
menfassungen oder journalistische Aufarbeitung.?’ 

Im Allgemeinen unterscheiden sich Kommentare von politischen Ak- 
teur:innen und User:innen in vielerlei Hinsicht von anderen fur inhaltsanaly- 
tische Ansatze genutzten Texten. Die Texte beinhalten eine wenig formalisier- 
te Sprache mit einem großen und diversen Vokabular, zusätzlich erschweren 
Rechtschreibungsfehler oder Abkürzungen die Analysen.?® Des Weiteren sind 
die Themen vielschichtig, das heißt, es wird sowohl innerhalb einer Nachricht 
als auch in der Grundgesamtheit die Bandbreite der gesellschaftlichen Kommu- 
nikation abgedeckt. Es gibt keine Kodierung dieser Themenbandbreite, sie wird 
in unkodierter und unstrukturierter Form veröffentlicht. Diese Charakteristika 
erschweren eine überwachte Analyse dieser Kommunikation. Der Diskurs um- 
fasst eine stetig steigende Menge an Nachrichten. Zudem verändert sich der 
thematische Schwerpunkt im Zeitverlauf. Während manche Themen an Bedeu- 
tung verlieren oder verschwinden, werden andere Themen und damit auch ein 
erweitertes Vokabular relevant. Sichtbar ist die Wandlung von Themenschwer- 
punkten ex post, zum Beispiel in handkodierten Parteiprogrammen.?9 

Das Themenspektrum deckt zeitlich und gesellschaftlich die vorhandene 
Bandbreite ab. Diese Vielseitigkeit legt die Relevanz der Texte nahe. Es werden 
bevölkerungsrelevante Themen in nicht interpretierter oder gefilterter Form 
analysiert. Es können Themen erkannt werden, die in Surveys oder anderwei- 
tigen theoriegeleiteten Analysemethoden noch nicht abgefragt oder erkannt 
werden können. Die datengetriebene, explorative Methodik hat demgegenüber 
den Vorteil, dass sie die vorhandene Kommunikation in umfassender Form be- 
trachtet und auswertet. 

Anwendungsbereiche können unter anderem im politischen Kontext 
(Parteienkommunikation) und im Konsument:innenverhalten zu finden sein. 
Im politischen Kontext können sowohl spezifische wirtschaftspolitische The- 
men erkannt werden, als auch die Gesamtkommunikation und ihre Wirkung 
auf Wähler:innen erfasst werden. Konsument:innen / die Bevölkerung stellen 
ihre Ansichten, Gedanken und Erfahrungen auf diversen Sozialen Medien dar. 


27 Stieglitz/Dang-Xuan (2013); Hong/Nadler (2071). 
28 Hu/Liu (2012). 
29 Volkens et al. (2020). 
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Vorteile Sozialer Medien 


Die Verbreitung und massenhafte Nutzung Sozialer Medien begann Mitte der 
2000er-Jahre. Die Nutzung der verschiedenen Sozialen Medien steigt seitdem 
stetig an. Während sie zu Beginn auf regionale Verknüpfungen und vor allem ein 
junges Publikum begrenzt war, sind mittlerweile alle Altersgruppen, Geschlech- 
ter und gesellschaftlichen Schichten auf den Sozialen Medien miteinander ver- 
bunden.?° Die flächendeckende Verbreitung von Smartphones ermöglicht die 
orts- und zeitunabhängige Nutzung durch die Konsument:innen/Wahler:innen.3! 
Die Verbreitung der verschiedenen Medien unterscheidet sich je nach dem be- 
trachteten Land zum Teil deutlich. Während in den Vereinigten Staaten der Groß- 
teil der Bevölkerung mindestens eine (teilweise) öffentliche Plattform nutzt, ist 
etwa in Deutschland die Nutzung nach wie vor in den jüngeren Altersgruppen 
weiter verbreitet. Zudem unterscheidet sich die Verbreitung der verschiedenen 
Plattformen. In Deutschland ist Facebook die am stärksten genutzte Plattform, 
auf den weiteren Rängen finden sich Twitter und stetig wachsend Instagram.?? 
In den Vereinigten Staaten hingegen ist Twitter die meistgenutzte Plattform.?® 
Ein weiterer Unterschied im internationalen Vergleich zeigt sich in der Nutzung 
der Plattformen. Während in den USA schnell eine kommerzielle und politische 
Nutzung vorangeschritten ist, ist in vielen europäischen Staaten die kommerzia- 
lisierte Nutzung der Plattformen ein vergleichsweise neues Phänomen. 

Soziale Medien, als relativ neues Medium, stellen neue Herausforderun- 
gen an Auswertungsmethoden. Sie können jedoch durchaus in Zeitreihen an- 
gewandt werden.*4 Im politischen Kontext ist eine Auswertung seit Beginn der 
2010er-Jahre möglich. In den USA werden seit Längerem über Mikrotargeting 
Wähler:innen gesucht, welche für Politiker:innen ansprechbar sind. In Europa 
sind derartige Auswertungen nicht mit den Datenschutzbestimmungen verein- 
bar. Die Anwendung von Mikrotargeting ist bereits länger möglich, da es sich 
um Einzelpersonen als Untersuchungsobjekte handelt.?® Eine systematische 
Analyse zum Beispiel der politischen Kommunikation durch Entscheidungsträ- 
ger:innen hingegen, bedarf der Aktivität von Parteien und Politiker:innen auf 


30 Java et al. (2007). 

31 Beisch/Schafer (2020). 

32 Ebenda. 

33 Hu/Liu (2012). 

34 Hu/Liu (2012). 

° Zuiderveen Borgesius et al. (2018); Papakyriakopoulos et al. (2017). 
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sozialen Kanälen. Die Notwendigkeit wurde von Parteien und Politiker:innen 
erst stückweise erkannt. Im deutschen Kontext ist die Wahlperiode 2013 bis 2017 
die erste flächendeckend auswertbare Periode. Für die Bundestagswahl 2013 ist 
die kurzfristige Wahlkampfstrategie bereits analysierbar. Für Konsument:innen 
gelten ähnlich strenge Datenschutzbestimmungen zur Anonymisierung von 
Einzelpersonen. Die Datennotwendigkeiten für die Analyse von Konsument- 
scheidungen entsprechen jenen für politisches Mikrotargeting 

Die Vorteile der Sozialen Medien liegen auf der Hand. Auf den Sozialen 
Medien kommunizieren Einzelpersonen und Unternehmen oder Politiker:in- 
nen ohne Zeitverzug. Abgesehen von redaktionell verfassten Beiträgen spiegeln 
die Beiträge die aktuellen Gedanken oder Bedürfnisse ohne Interpretations- 
schritte oder kognitive Verzerrung wider. Zudem können Konsument:innen/ 
Produzent:innen oder Wähler:innen/Parteien direkt miteinander in Kontakt 
treten und auf die jeweils andere Seite reagieren. Die stetige Produktion neu- 
er Daten erlaubt eine tagesaktuelle Auswertung von Informationen. Zeitliche 
Restriktionen und Schlaglichter zu einem einzelnen Zeitpunkt können damit 
vermieden werden. 

Einerseits haben die Sozialen Medien klare Vorteile, doch andererseits 
gibt es einige Faktoren, die die Analyse behindern. Zum einen sind die Beiträge 
zum Teil sehr kurz gehalten, zum Beispiel auf Twitter. Zum anderen sind häufig 
viele verschiedene Themen innerhalb eines Posts zusammengefasst. Eine klare 
Trennung beziehungsweise Zuordnung der Anteile eines Posts stellt sich teil- 
weise als schwierig dar. Daneben erschwert die Formulierung der Nachrichten 
die Analyse, die Problematik ergibt sich aus der knappen und schnell verfass- 
ten Natur der Beiträge. Dabei werden unterschiedliche Abkürzungen für Wörter 
verwendet, Umgangssprache genutzt und es treten häufiger Rechtschreibungs- 
fehler auf. Diese Punkte erschweren die systematische Auswertung und erfor- 
dern ein ausgeprägtes pre-processing der Rohdaten.?° Abgesehen von offiziellen 
Accounts besteht die Möglichkeit, dass Personen sich auf Sozialen Medien nicht 
mit ihrer wahren Identität oder ihrem wahren Standort anmelden. Problema- 
tisch sind dabei insbesondere Bots, welche eine große Anzahl an Beiträgen au- 
tomatisiert verfassen. Um diese Accounts zu filtern und nicht fälschlicherweise 
in ungewolltem Kontext in Analysen zu integrieren, lassen sich Algorithmen 


35 Hu/Liu (2012). 
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einsetzen. Bei einem Bewusstsein der Problematik gegentiber lasst sich somit 
eine falschliche Integration verhindern.?” 


Anwendungen Sozialer Medien 


Die Anwendungen zur textbasierten Auswertung sozialer Medien sind sehr 
vielschichtig. Die Möglichkeiten und Anwendungen erwachsen aus der hohen 
Nutzerzahl, der globalen Verfügbarkeit und dem vielfältigen Nutzerkreis. Wäh- 
rend für die Analyse und Vorhersage der Börsen/Aktienkurse unter anderem 
öffentliche Profile und Statements der Zentralbanken und/oder Politiker:innen 
genutzt werden,?® stehen bei „social emotion“- und „opinion mining“-Studien 
private Statements der gesamten Nutzerbasis im Mittelpunkt.?® Aus der Be- 
trachtung sozialer Emotionen lassen sich über automatisierte Verfahren zu- 
sätzlich Sentiment-Lexika entwickeln.*° Darüber hinaus bieten sich die Sozialen 
Medien für die Erfassung von Events und Wendepunkten an.*! Die Betrachtung 
des Konsument:innenverhaltens (siehe dazu nachfolgend den Beitrag in diesem 
Band) nutzt zumeist Sentiments und die gesamte Nutzerbasis eines definierten 
Georaums.“ Ähnlich wie in diesem Beitrag werden die Sozialen Medien für die 
Analyse politischer Themen und des Parteiwettbewerbs genutzt.“ 

Eine konkrete Anwendung im Bereich der politischen Kommunikation 
analysiert das Kommunikationsverhalten deutscher Parteien in der Legislatur- 
periode 2013 bis 2017. Es wurden die offiziellen Facebook-Seiten der Bundespar- 
teien sowie der jeweiligen Parteivorsitzenden und des Generalsekretärs genutzt 
(siehe Tabelle 1). Im Zeitraum von Januar 2014 bis Dezember 2017 konnte so die 
gesamte Wahlperiode inklusive der Koalitionsverhandlungen abgebildet wer- 
den. Für die gewählte Periode konnten zwischen 30 und 40 Themen pro Par- 
teien identifiziert werden. Die Auswertung der Facebook-Beiträge erfolgte über 


37 Zum Beispiel Cai/Li/Zengi (2017). 

38 Nguyen/Shirai (2015); Besimi et al. (2019); Bollen/Mao/Zeng (2011); Oliveira/Cortez/Areal (2017). 
39 Rao et al. (2014); Bao et al. (2009); Vamshi/Pandey/Siva (2018). 

4° Deng et al. (2019); Xie/Li (2012). 

41 Xue et al. (2020); Qian et al. (2016). 

42 Homburg/Ehm/Artz (2015); Daas/Puts (2014); Pekar/Binner (2017). 


Joshi/Bhattacharyya/Carman; Takikawa/Nagayoshi (2017); Oliveira et al. (2018); Antonakaki et al. 
(2017). 
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Latent Dirichlet Allocation“, eine unüberwachte Soft-Clustering-Methode. Die 
Daten wurden auf monatlicher Basis akkumuliert, um eine Aussage uber das 
Kommunikationsverhalten, die Schwerpunkte und Veranderungen zu treffen. 
Die Parteienkommunikation wird separat ausgewertet, mit dem Ziel kleinere 
Themen oder Themendifferenzierungen der Parteien zu generieren. 


Tab. 1: Parteien und Politker:innen im Datensatz 

PARTEI 

AfD Frauke Petry örg Meuthen 
CSU Horst Seehofer Andreas Scheuer 
CDU Angela Merkel Peter Tauber 
FDP Christian Lindner Nicola Beer 

SPD Sigmar Gabriel Hubertus Heil 
BÜNDNIS 90 / DIE GRÜNEN Cem Özdemir Simone Peter 
DIE LINKE Bernd Riexinger atja Kipping 


Der Algorithmus gibt die prozentualen Anteile der einzelnen Themen inner- 
halb eines Beitrags und die wichtigsten Wörter eines Clusters aus. Zusätzlich 
wurde der Sentiment Score erstellt. Der Sentiment Score wird auf einer Skala 
von -1bis +1, auf der Grundlage eines Wörterbuchs errechnet. Für das Wörter- 
buch wurden von Experten Wörter hinsichtlich ihrer positiven oder negativen 
Konnotation kodiert.*° Der Sentiment Score für ein Dokument i mit den Sen- 
timent-Wortwerten w und dem Gesamtvokabular v errechnet sich wie in der 
folgenden Formel dargestellt. 
os È Wpos,i —  Wneg,i 
i LY; 
Im Ergebnis konnten signifikante und den Parteien entsprechende Ergebnis- 
se erzielt werden. Das Profil der Parteien, insbesondere der kleinen Parteien, 
entspricht den Schwerpunktsetzungen in den Wahlprogrammen. Der Vorteil 
anderen Ansatzen gegenuber ist die monatliche Auswertbarkeit und darauf 
aufbauend die Möglichkeit von Analysen der Reaktionen von Wähler:innen. 
Beispielhaft werden an dieser Stelle die Ergebnisse zur Arbeitsmarktpolitik, zur 
Sozial- und Familienpolitik, zur wirtschaftlichen Entwicklung Deutschlands so- 
wie zu außergewöhnlichen Ereignissen und deren Erkennung betrachtet. 


44 Blei/Ng/Jordan (2003). 
45 Remus/Quasthoff/Heyer (2010). 
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Die Anwendung von Latent Dirichlet Allocation (LDA) gibt als Resultat 
zwei Ergebnisse aus. Zum einen werden die Themencluster in Form der hau- 
figsten Wörter ausgegeben. Zum anderen wird für jeden Text der zugehörige 
prozentuale Anteil an einem Thema ausgegeben. Durch die Definition der Para- 
meter kann festgelegt werden, ob viele oder wenige Themen pro Nachricht er- 
wartet werden. Im nachfolgenden Fall wurde, ausgehend von dem tendenziell 
kurzen Charakter der Facebook-Posts angenommen, dass wenige Themen pro 
Nachricht kommuniziert werden. Für die Interpretation ist relevant, dass ein 
Thema, welches in den Clustern nicht auftaucht, nicht zwangsläufig gar nicht 
behandelt wird. Es wird jedoch in entweder deutlich untergeordneter Relevanz 
oder in nicht differenziertem Vokabular kommuniziert. 


Tab. 2: Codebuch — Auszug zu Sozialpolitik und Budget, Wachstum und Entwicklung 


SOZIALPOLITIK 


Arbeitsmarkt Arbeitslosigkeit 

Löhne 

Arbeitslosengeld (Hartz IV) 
Soziale Sicherungssysteme 
Arbeitsrecht 
Gewerkschaften 

Start-ups 


Rentenpolitik Rentenversicherung 
Altersarmut 


Familienpolitik Work-Life-Balance 
Mütterrente 
Elterngeld 
Kinderarmut 


Pflege 


Wohnraum 


Bildungspolitik 


BUDGET, WACHSTUM, ENTWICKLUNG 


Budget Schwarze Null 
Investitionen 
Vermögen Vermögenssteuer 
Wachstum Wachstumsfaktoren 
Prosperity 
Freihandel TTIP 
CETA 


Digitalisierung 


Ländliche Entwicklung 
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Die resultierenden Wortlisten mussen kodiert werden. Auf Basis eines detaillier- 
ten Codebuchs konnen die Listen Themen zugeordnet werden. Beispielhaft sind 
in Tabelle 2 die Abschnitte des Codebuchs für die Themenfelder Sozialpolitik, 
Budget, Wachstum und Entwicklung abgebildet. Das Codebuch wurde in einem 
explorativen Ansatz entwickelt, basierend auf den Resultaten der LDA-Cluster. 
Der Vorteil der automatisierten Textanalyse liegt im frühzeitigen Erkennen 
neuer Themenfelder, daher ist ein explorativer Ansatz der Themengenerierung 
sinnvoll. 


Tab. 3: Themenliste — Arbeitsmarkt 
DIE LINKE 
ARBEITSRECHT GEWERKSCHAFTEN LOHNE ARBEITSLOSIGKEIT 
„arbeit“ „beschaeftigt“ „euro“ „hartz“ 
„gut“ „gewerkschaft“ „mindestlohn“ „sanktion“ 
„leiharbeit“ „gut“ „million“ „betroff“ 
„beschaeftigt“ „arbeit“ „jahr“ „abschaff“ 
„mensch“ „verdi“ „milliard“ „grundrecht“ 
„leb“ „unterstuetz“ „unternehm“ „jobcent“ 
„befrist“ „streik“ „zahl“ „sanktionsfrei“ 
„job“ „loehn“ „ausnahm“ „mindestsicher“ 
„preka“ „amazon“ „niedrig“ „bundesregier“ 
"gleich" „metall“ „fordert“ „andrea“ 
SPD CSU CDU 
LOHNE/ ARBEITSLOSIGKEIT/ a 
A LOHNE ARBEITSLOSIGKEIT 
GEWERKSCHAFTEN LOHNE 
„mindestlohn“ „loewenstark“ „sich“ „deutschland“ 
„rent“ „gut“ „stark“ „gut“ 
„arbeit“ „best“ „deutschland“ „mensch“ 
„mensch“ „digital“ „inn“ „wirtschaft“ 
„gut“ „wirtschaft“ „wirtschaft“ „jahr“ 
„jahr“ „prozent“ „arbeit“ „arbeitslos“ 
„gesetz“ „arbeitslosenquot“ „bleibt“ „zahl“ 
„prozent“ „arbeitsmarkt“ „wohlstand“ „arbeit“ 
„arbeitnehm“ „freistaat“ „arbeitsplaetz“ „prozent“ 
„andrea“ „top“ „zeit“ „arbeitsmarkt“ 
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Die Parteien diskutieren in Bezug auf die wichtigen wirtschafts- und sozialpo- 
litischen Themenfelder die gleichen Oberthemen. Die Unterscheidung wird in 
der Diskurssetzung, also den praziseren Unterthemen, evident. Dies wird bei 
sozialpolitischen Themen deutlich. Tabelle 2 weist die zehn Worter aus, die im 
Rahmen von arbeitsmarktbezogenen Themen am haufigsten verwendet wur- 
den. Die zuvor beschriebene Unterteilung der Themen wird hier verdeutlicht. 
Darüber hinaus zeigt das Agenda-Setting sowohl den Unterschied zwischen 
Mitte-Links- und Mitte-Rechts-Parteien als auch die Konzentration auf eine 
kontroverse versus eine ergebnisorientierte Debattenstruktur. 

Während in der Linken ein breites Spektrum von Arbeitsmarktfragen 
unter besonderer Berücksichtigung der sozialen Gerechtigkeit diskutiert wird, 
konzentriert sich die CDU auf Erfolge und gute Arbeitsmarktbedingungen im 
Sinne einer niedrigen Arbeitslosigkeit. Die Unterschiede zwischen Mitte-Links- 
und Mitte-Rechts-Parteien werden auch im Vergleich von CDU und SPD sicht- 
bar. Beide Parteien gingen 2013 eine Koalition ein, wobei sich die SPD auf zent- 
rale sozialdemokratische Themen wie den Mindestlohn konzentriert, der jedoch 
von der CDU nicht erwähnt wird. Das obige Beispiel zeigt, zu welchen sinnvollen 
Ergebnissen die Anwendung von Themenmodellen auf die offizielle Social-Me- 
dia-Kommunikation der Parteien führt. Auffällig ist bei den weiteren Themen 
der sozialpolitischen Kommunikation auch die Zuordenbarkeit der Themen 
zu Parteien oder mindestens die Regierungszugehörigkeit oder das politische 
Spektrum. 

So werden zum Beispiel von allen Parteien, CDU und CSU ausgenommen, 
die Freihandelsabkommen TTIP und CETA behandelt. Während die Linke und 
die Grünen den Abkommen eher ablehnend gegenüberstehen, kann aus den 
zehn häufigsten Wörtern bei SPD und AfD keine klare Positionierung abgeleitet 
werden. Die FDP kommt in den zehn häufigsten Wörtern eher zu einem posi- 
tiven Urteil. Linke und Grüne diskutieren zudem ihre Kernthemen Umvertei- 
lung respektive Umweltschutz im Zusammenhang mit der wirtschaftlichen 
Entwicklung Deutschlands. Bei den Regierungsparteien und der FDP kommt die 
Digitalisierung hinzu. Während bei SPD und CDU der Fortschritt im Tenor eher 
positiv klingt, deutet die Kommunikation der FDP aufkritische Aspekte in Bezug 
auf die Digitalisierungsstrategie hin. Insgesamt zeichnen die wirtschaftspoliti- 
schen Themen, ähnlich wie die sozialpolitischen Themen, das Profil der Parteien 
und ihrer Ausrichtung nach. 
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Tab.4: Themenliste — Budget, Wachstum und Entwicklung 
DIE LINKE AFD 
FREIHANDEL VERMÖGENSTEUER TTIP WACHSTUM a 
1 „etip“ „reich“ „buerg“ „deutschland“ „euro“ 
2 „ceta“ „deutschland“ „ttip“ „jahr“ „geld“ 
3 „stopp“ „prozent“ „bargeld“ „zahl“ „jahr“ 
4 „polit“ „gerecht“ „freiheit“ „prozent“ „kost“ 
5 „konzern“ „sozial“ „lehnt“ „Studi“ „milliard“ 
6 „freihandelsabkomm“ „reichtum“ „oeffent“ „polit“ „million“ 
7 „demokrati“ „vermoeg“ „kontroll“ „mensch“ „steuerzahl“ 
8 „aktion“ „land“ „staat“ „deutsch“ „pro“ 
9 „mensch“ „einkomm“ „abschaff“ „articl“ „hoeh“ 
10 „abkomm“ „gesellschaft“ „gross“ „wirtschaft“ „steu“ 
BÜNDNIS 90 / DIE GRÜNEN SPD 
WACHSTUMS- WACHSTUMS- DIGITALISIE- 
FAKTOREN EREIHANDEL FAKTOREN Te RUNG 
1 „gerecht“ „ttip“ „wirtschaft“ „ttip“ „digital“ 
2 „sozial“ „ceta“ „unternehm“ „bundesregier“ „frag“ 
3 „oekolog“ „umwelt“ „deutschland“ „ceta“ „zukunft“ 
4 „gesellschaft“ „fair“ „deutsch“ „kommission“ „digitalleb“ 
5 „wirtschaft“ „stopp“ „industri „freihandelsab- „arbeit“ 
komm 
6  „weltoff“ „handel“ „jahr“ „bmwi“ „digitalisier“ 
7 „umwelt“ „handelsabkomm“ ,arbeitsplaetz“  „entscheid“ „diskuti“ 
8 „zentral“ „usa“ „zukunft“ „oeffent“ „gesellschaft“ 
9 „arbeit“ „mensch“ „stark“ „debatt“ „leb“ 
10 „zusammenhalt“ „konzern“ „gut“ „verhandl“ „thema“ 
CSU CDU 
LANDLICHE SCHWARZE DIGITALISIE- LANDLICHE 
ENTWICKLUNG INVESTITIONEN NULL RUNG ENTWICKLUNG 
1 „gross“ „euro“ „jahr“ „digital“ „gefuehrt“ 
2 „polit“ „bund“ „schuld“ „digitalisier“ „bundesregier“ 
3 „zeit“ „jahr“ „haushalt“ „thema“ „euro“ 
4 „gemeinsam“ „laend“ „bundestag“ „diskutiert“ „gut“ 
5 „wichtig“ „milliard“ „schwarz“ „chanc“ „infos“ 
6 „herausforder“ „zukunft“ „forschung“ „wirtschaft“ „milliard“ 
7 „bleib“ „schuld“ „bildung“ „frag“ „pfleg“ 
3 „gut“ „bundesla“ „solid“ „wandel“ „nachricht“ 
9 „dialog“ „finanz“ „null“ „mittelpunkt“ „internet“ 
10 „gespraech“ „entlast“ „betont“ „diskuti“ „bund“ 
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FDP 

BUDGET TTIP DIGITALISIERUNG START-UPS 
1 „steu“ „wirtschaft“ „deutschland“ „bess“ 
2 „entlast“ „deutsch“ „digitalisier“ „deutschland“ 
3 „soli“ „ttip“ „digital“ „arbeit“ 
4 „wissing“ „arbeitsplaetz“ „chanc“ „gruend“ 
5 „euro“ „gut“ „bildung“ „ide“ 
6 N seed „gerad“ „braucht“ „unternehm“ 
7 „kalt“ „unternehm“ „endlich“ „buerokrati“ 
8 „progression“ „handwerk“ „brauch“ „fordert“ 
9 „buerg“ „mindestlohn“ „infrastruktur“ „gerad“ 
10 „geld“ „wohlstand“ „agenda“ „braucht“ 


Nachdem die Themencluster codiert sind, kann der prozentuale Anteil der Kom- 
munikation an den Themenclustern ermittelt werden. Um eine aussagekräftige 
Verteilung zu erzielen, werden hierfür die Oberthemen Sozialpolitik und Bud- 
get, Wachstum und Entwicklung in der Darstellung kumuliert. Für eine präzi- 
sere Auswertung und konkrete Anwendungen im Bereich der Wählerreaktion 
können die detaillierteren Themenfelder wie Arbeitsmarkt oder Familienpolitik 
genutzt werden. 

In Abbildung 2 wird die kumulierte Kommunikation der Bundespartei- 
en zu sozialpolitischen Themen (zur Ausrichtung der Debatte siehe Tabelle 4) 
dargestellt. Exemplarisch zeigen die sozialpolitischen Themen, dass die Partei- 
en bezüglich der kommunizierten Themen starke Schwerpunkte setzen. Über 
den gesamten Zeitraum hinweg bestreitet die Linke das Thema in ausgeprägter 
Form. Die regierungsbeteiligten Parteien SPD und CDU folgen mit einer gleich- 
bleibend hohen Beteiligung am Themenspektrum, verweisen dabei jedoch 
hauptsächlich auf arbeitsmarktbezogene Themen und im Fall der CDU auf Er- 
folge der Regierung. 

Am rechten Rand des politischen Spektrums wird der Akzent auf migra- 
tionsbezogene Themen gesetzt und als Wahlkampfthema im September 2017 
weiter intensiviert. Abbildung 3 zeigt zwei Phänomene deutlich auf. Zum einen 
ist ein Anstieg der Kommunikation, ausgelöst durch ein externes Ereignis, zu se- 
hen (Anstieg der Zuwanderung Geflüchteter 2015). Zum anderen kann, ähnlich 
wie in der sozialpolitischen Kommunikation, die Vereinnahmung eines Themas 
durch einzelne Parteien beobachtet werden: Die Kommunikation der CSU und 
der AfD über zuwanderungsrelevanten Themen nimmt zu. 
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Abb.2: Monatlich kumulierte Kommunikation — Sozialpolitik 
Quelle: eigene Darstellung. 


Ebenfalls zu beobachten ist in der sozialpolitischen Kommunikation, dass die Ver- 
einnahmung eines Themas mit einer problemorientierten Darstellung der The- 
matik einhergeht. Während insbesondere das linke Parteienspektrum die Integ- 
ration und die Fluchtursachen thematisiert, werden von CSU und AfD verstärkt 
die Konsequenzen und problematischen Aspekte der Zuwanderung dargestellt. 
Des Weiteren ist bei der AfD zu beobachten, dass, ähnlich wie bei der Partei DIE 
LINKE, das Thema in vielen Varianten kommuniziert wird. Als interessant zu ver- 
merken ist zudem, dass der Wechsel an der AfD-Parteispitze (5. Juli 2015) und da- 
mit die Neuausrichtung deutlich zu erkennen ist, Euro-kritische Themen werden 
zu migrationskritischen Themen. Dies ist umso bezeichnender, als über den ge- 
samten Zeitraum dieselben Personen in die Analyse einbezogen waren. 

Die Analyse der Relevanz einzelner Themen zeigt drei zu erwartende und 
wichtige Phänomene der politischen Kommunikation. Erstens: Kleine und Op- 
positionsparteien verfolgen die Strategie, einzelne Themen für sich zu verein- 
nahmen und den Diskurs zu bestimmen.*¢ Zweitens können externe Effekte mit 
politischer Durchschlagskraft in der öffentlichen Kommunikation zuverlässig 
erkannt werden. Drittens werden Strategiewechsel, innerparteiliche Auseinan- 
dersetzungen und wahlkampfstrategische Überlegungen evident. 


6 Die Ergebnisse werden von verschiedenen Studien zur strategischen Ausrichtung von Parteien 
unterstützt (siehe zum Beispiel Dragu/Fan [2016]; Glazer/Lohmann [1999)). 
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Abb.3: Monatlich kumulierte Kommunikation — Migration 
Quelle: eigene Darstellung. 


Um eine empirische Auswertung der Daten zu ermöglichen, muss der Tenor 
der Parteienkommunikation quantifiziert werden. Verschiedene Ansätze kön- 
nen hierfür verwandt werden. Die einfachste Möglichkeit ist die Verwendung 
eines wörterbuchbasierten Verfahrens zur Berechnung der Sentiments einzel- 
ner Wörter. Ein Problem dieser Methodik liegt in der Ausgestaltung des Wör- 
terbuchs. Gerade Wortneuschöpfungen mit einem stark positiven oder negati- 
ven Charakter sind in den Wörterbüchern selten enthalten. Einen Eindruck von 
der Kommunikation spiegelt die Methode jedoch gut wider. Exemplarisch sind 
an dieser Stelle die Oppositionsparteien (DIE LINKE, BÜNDNIS 90 / DIE GRÜNEN, 
FDP, AfD) sowie die Regierungsparteien dargestellt. Oppositionsparteien fallen 
durch ihre weitestgehend negativen Sentiment-Werte auf (Abbildung 4). Die 
Regierungsparteien hingegen sind überwiegend im positiven Wertebereich zu 
finden. Dies deutet auf eine sehr unterschiedliche Darstellung der Lage in ver- 
schiedenen Themenbereichen und die Hervorhebung der Erfolge auf Seiten der 
Regierungsparteien hin. 

Weitere Ansätze zur Analyse beinhalten maschinelle Ansätze zum NLP 
oder psychologische Ansätze zur Generierung eines psychologischen Motivs. 
Diese Methodik wird im letzten Beitrag in diesem Band genauer betrachtet. 
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Abb. 4: Kumulierte Sentiment Scores — Regierungs- und Oppositionsparteien 
Quelle: eigene Darstellung. 


Die Ergebnisse zeigen die vielfältigen Möglichkeiten auf, mit denen textbasier- 
te Verfahren in der politischen Analyse eingesetzt werden konnen. Es konnen 
frühzeitig relevante Themen erkannt und ihre Wirkung auf Wahler:innen und 
Konsument:innen untersucht werden. Die Methodik erlaubt in weitestgehend 
automatisierter Form, die Profile von Parteien zu analysieren. Dies lasst sich auf 
vielfältige weitere Themenfelder übertragen. Neben politischer Kommunikati- 
on und wirtschaftspolitischen Aspekten können Trends der gesamtwirtschaft- 
lichen Entwicklung ausgewertet werden. Textdaten sollten daher in Forschung 
und Wirtschaft einen höheren Stellenwert erhalten. Sie können quantitative 
Ergebnisse unterstützen beziehungsweise sogar deren Aussagegehalt erhöhen. 


Schlussfolgerungen 


Wie gezeigt wurde, erfordert die Verwendung unstrukturierter Textdaten kom- 
plexe Auswertungsmethoden. Die Methoden können sich je nach Zielstellung 
unterscheiden. Gemeinsam ist ihnen allen das Ziel, mit möglichst geringen 
händischen Kodierungen große Textmengen zu analysieren. Während bei über- 
wachten Strategien die Kodierung eines Trainingsdatensets nötig ist, ist bei un- 
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uberwachten Strategien eine nachtragliche Kodierung der Cluster notwendig. 
Wie im Abschnitt „Texte als Daten“ gezeigt, haben beide Methoden Vorteile. 

Gerade für den in diesem Beitrag erläuterten Ansatz zur Analyse politi- 
scher Kommunikation bietet sich das unüberwachte Clusteringverfahren an. 
Die explorative Strategie kann kann dazu dienen, neue Themen zu erkennen 
und so gesellschaftliche Entwicklungen für spätere Analyseverfahren aufzu- 
decken. Das ermöglicht es, in Fore- und Nowcasts Entwicklungen abzubilden? 
welche in Surveys noch nicht als implementierte Frage integriert sind. Neben 
Clusteringmethoden können über Sentimentanalysen oder präzisere psycholo- 
gische Tools Informationen zu Stimmungen extrahiert werden. 

Verschiedene Veröffentlichungen zeigen bereits den Nutzen unstruktu- 
rierter Daten in empirischen Verfahren. So konnten Entwicklungen an Aktien- 
märkten, die Reaktion auf Zentralbankkommunikation und positive Zusam- 
menhänge zwischen Konsument:innenverhalten und Kommunikation in den 
Sozialen Medien identifiziert werden. 

Die Ergebnisse und die vielfältigen Anwendungsfelder zeigen das Poten- 
zial unstrukturierter Daten auf. Die Entwicklung zeigt in Richtung eines sich 
stetig ausweitenden Datenpools, eine Auswertung scheint daher ein vielver- 
sprechender und notwendiger Weg zu sein. Da die Methoden noch nicht gleich- 
wertig validiert sind, bleibt das Feld ausgesprochen dynamisch, und es ist mit 
zunehmend besseren Modellen und Ergebnissen zu rechnen. 
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Onlinedaten und Konsumentscheidungen 


Voraussagen anhand von Daten aus Social Media und 
Suchmaschinen 


Deniz Dilan Karaman Orsal 


Einleitung 


Dieser Beitrag beschaftigt sich mit dem Einsatz von Onlinedaten bei der Progno- 
se grundlegender makroökonomischer Indikatoren wie privatem Konsum und 
Konsumentenvertrauensindikatoren. Dabei werden aktuelle Veröffentlichun- 
gen zusammengefasst und neue Anwendungsmöglichkeiten von Onlinedaten 
aufgezeigt. 

Mit der breiten Nutzung des Internets und der rasanten Entwicklung der 
Digitalisierung stehen in den letzten Jahren neue und große Datenquellen zur 
Verfügung. Mit Hilfe von Kurznachrichten, überwiegend aus den sozialen Netz- 
werken (wie zum Beispiel Twitter, Facebook, Instagram, YouTube), oder aggre- 
gierten Indizes, die anhand von Suchanfragen konstruiert werden (wie unter 
anderem Google Trends, Google Insights), werden neue Vorhersagemodelle ent- 
wickelt, um wirtschaftliche Indikatoren frühzeitig beziehungsweise in Echtzeit 
zu prognostizieren. 

In der Literatur wird auf einen Zusammenhang zwischen der Stimmung der 
Konsument:innen und dem privaten Konsum hingewiesen. Da der private Kon- 
sum 60 % bis 70 % des Bruttoinlandsprodukts ausmacht, können Veränderungen 
in der Verbraucherstimmung Veränderungen im privaten Konsum signalisieren. 

Die Stimmung der Verbraucher:innen wird im Verlauf von Rezessionen 
akribisch beobachtet, da jede wesentliche Änderung oder jedes Fehlen einer 
Änderung als wichtiges Zeichen eines nahe gelegenen Wendepunkts oder einer 
Verlängerung des Tiefs angesehen wird.! 


1 Vuchelen (2004). 
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Abb.1: Veränderungen im privaten Konsum und Konsumentenvertrauensindex in den USA 


Quelle: Eigene Darstellung, basierend auf Federal State Bank of St. Louis, https://fred.stlouisfed. 
org/; University of Michigan http://www.sca.isr.umich.edu/tables.html. 


Abbildung 1 gibt einen ersten Eindruck davon, wie sich der private Konsum und 
das Konsumentenvertrauen in den USA zwischen 1990 und 2019 verändert ha- 
ben und inwieweit die Verläufe der beiden Variablen sich ähneln. Es ist deut- 
lich erkennbar, dass der umfragebasierte Konsumentenvertrauensindex der 
University of Michigan den enormen Rückgang im privaten Konsum im Zuge 
der Großen Rezession früher erkennen konnte. Anders ausgedrückt lässt sich 
schlussfolgern, dass es möglich sein kann, mit der Analyse der Verbraucherstim- 
mung die Veränderungen in den Konsumentscheidungen zu modellieren bezie- 
hungsweise vorauszusagen. Da allerdings die umfragebasierten Konsumenten- 
vertrauensindizes verzögert veröffentlicht werden und ihre Ermittlung sehr 
zeit-und kostenintensiv ist, wurden in den letzten Jahren Daten sowohl aus den 
Sozialen Medien als auch Anfragen bei den Onlinesuchmaschinen verwendet, 
um die Stimmung der Konsumenten zeitgenauer zu messen. 

Daher werden im nächsten Abschnitt die aktuellsten Studien zusammen- 
gefasst, die Daten aus den Sozialen Medien anwenden, um Konsumentschei- 
dungen und Konsumentenvertrauen zu prognostizieren. Der nachfolgende 


Onlinedaten und Konsumentscheidungen 159 


Abschnitt liefert eine Übersicht über die jüngsten Untersuchungen des Kon- 
sumverhaltens, die sich auf Onlinesuchanfragen stützen. Anschließend wird 
in dem letzten Abschnitt auf die Grenzen und Möglichkeiten der Analyse mit 
Onlinedaten aufmerksam gemacht und auf die möglichen Herausforderungen 
hingedeutet. 


Soziale Medien und Konsumentscheidungen 


Seit einigen Jahren werden Textdaten aus Sozialen Medien, Blogs, und Foren 
auch in der Erforschung der Konsumentscheidungen verwendet. Dabei werden 
überwiegend Kurznachrichten aus den Social-Media-Plattformen wie Twitter 
und Facebook benutzt. Seit 2004 stellt Facebook einen Online-Social-Networ- 
king-Dienst zur Verfügung. Mit seinen 2,7 Milliarden Nutzer:innen weltweit? ist 
Facebook die populärste Social-Networking-Plattform überhaupt. Da aber die 
Facebook-Posts nur durch von Nutzer:innen zugelassenen Personen gelesen 
oder kommentiert werden können und für Drittpersonen nicht zur Verfügung 
stehen, ist es nicht zielführend, ausgehend von den Posts eine allgemeine für 
die Konsumentscheidungen relevante Meinung ableiten zu wollen. Dies ist nur 
möglich wenn die Nutzer:innen in Facebook-Gruppen interagieren beziehungs- 
weise zu Werbungen auf der Facebook-Plattform reagieren beziehungsweise 
Kommentare abgeben. Darüber hinaus ist es auch aus datenschutzrechtlichen 
Gründen nicht möglich, die Facebook-Nachrichten, die Drittpersonen nicht zur 
Verfügung stehen, zu analysieren. Daher konzentriert sich dieser Abschnitt auf 
die Kurznachrichten aus der Social-Media-Plattform Twitter. 

Das Social-Networking-Unternehmen Twitter bietet seit 2006 einen On- 
linedienst für Mikroblogging. Registrierte Nutzer:innen dürfen auf der Twit- 
ter-Plattform kurze Nachrichten (die sogenannten Tweets) senden und mit 
anderen Nutzer:innen interagieren, wobei die nicht registrierten Nutzer:innen 
diese Tweets nur lesen dürfen. Die Länge der Tweets ist seit November 2017 auf 
höchstens 280 Zeichen begrenzt, mit der Ausnahme der Tweets in chinesischer, 
japanischer und koreanischer Sprache, welche nur aus 140 Zeichen zusammen- 
gesetzt sein dürfen. Die 340 Millionen Twitter-Nutzer:innen weltweit senden 


? Vgl. Statista, https://www.statista.com/statistics/264810/number-of- 
monthly-active-facebook-users-worldwide/, aufgerufen am 23.12.2020. 
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täglich durchschnittlich 500 Millionen Tweets.? Damit ist Twitter weltweit eine 
der größten Social-Media-Plattformen. 
Tag für Tag steigen die Zahl der Nutzer:innen und die Zahl der Tweets an. 
Social-Media-Plattformen beeinflussen den Alltag in vielfacher Weise und mit 
steigender Tendenz. Mittlerweile ist Twitter als wichtiges Medium für Politi- 
ker:innen, Journalist:innen und Unternehmen unerlässlich geworden. Durch 
Twitter haben Forscher:innen Zugang zu einer riesigen Datenmenge, mit der 
sie „wertvolle Einblicke in das Verhalten von Menschen, ihre Stimmungen, ihre 
Konsummuster, ihre Sprache und ihre Abstimmungen“ bekommen können. Da- 
her wird es wichtiger, notwendiger und erkenntnisreicher denn je, Twitter-Da- 
ten zu analysieren.4 
In letzter Zeit haben Tweets vermehrt Anwendung gefunden, um die 
führenden Aktienmarktindizes® wie Dow Jones Industrial Average, NASDAQ 
Composite und S&P 500 oder Rendite, Volatilität und Handelsvolumen® für S&P 
500 vorherzusagen. Die Untersuchungsergebnisse haben gezeigt, dass sich die 
Vorhersagegenauigkeit durch die Einbeziehung der Stimmung in den sozialen 
Netzwerken verbessert. 
Es gibt einige Studien, die sich mit der Prognose der Konsumentenvertrau- 
ensindikatoren anhand von Twitter-Kurznachrichten befassen’. Die Stimmung 
der Twitter-Nutzer:innen wird dabei mit den umfragebasierten Konsumenten- 
vertrauensindizes verglichen. Um diese umfragebasierten Konsumentenver- 
trauensindizes zu konstruieren, wird monatlich eine zufällige Stichprobe von 
Verbraucher:innen befragt. Dabei beantworten die Interviewten Fragen zu 
- ihrer finanziellen Situation in den letzten und in den nächsten zwölf Monaten, 
- der allgemeinen wirtschaftlichen Lage in den letzten und in den nächsten 
zwölf Monaten, 

-  Preistrendsin den letzten und in den nächsten zwölf Monaten, 

- ihren geplanten großen Einkäufen derzeit und in den nächsten zwölf Mo- 
naten, 

- Einsparungen derzeit und in den nächsten zwölf Monaten, 

- Ihren Erwartungen der Arbeitslosigkeit in den nächsten ı2 Monaten. 


? Statista, online unter https://de.statista.com/themen/gg/twitter/, zuletzt aufgerufen am 7.7.2021. 
* Puschmann et al. (2014). 

> Bollen/Mao/Zeng (2011); Zhang (2017); Zhang/Fuehres/Gloor (2011); Oliveira/Cortez/Areal (2017). 
6 Oliveira et al. (2017). 

7 Daas/Puts (2014); Shayaa et al. (2018); Shayaa et al. (2017). 


Onlinedaten und Konsumentscheidungen 161 


Mit Hilfe einer Sentimentanalyse® wird die Stimmung der Konsumenten basie- 
rend auf ihren Kurznachrichten in den Sozialen Medien (Tweets, Facebook-Posts) 
gemessen. 

Die Sentimentanalyse, auch Opinion Mining genannt, ist ein Forschungs- 
gebiet, das sich mit der Analyse der Meinungen, Gefühle, Einschätzungen, Ein- 
stellungen und Emotionen der Menschen gegenüber Objekten und ihren Attri- 
buten, die sie in geschriebenem Text ausdrücken, befasst. Diese Objekte können 
Produkte, Dienstleistungen, Organisationen, Einzelpersonen, Veranstaltungen 
oder Themen sein.? 

In Tabelle ı werden die jüngsten Studien aus der Literatur zusammenge- 
fasst, die Textdaten überwiegend aus Sozialen Medien nutzen, um Konsumen- 
tenvertrauen beziehungsweise Konsumentscheidungen vorauszusagen. 

Wie Tabelle ı offenbart, benutzen verschiedene Studien unterschiedliche 
Such- und Schlagwörter, um die Kurznachrichten beziehungsweise Einträge in 
den Foren zu „scrapen“ (das heißt, zu schürfen). Wie oben erläutert wurde, wird 
dabei die Sentimentanalyse eingesetzt. Durch die Korrelationsanalyse wird 
die Stärke des Zusammenhangs zwischen dem umfragebasierten Konsumen- 
tenvertrauensindex und dem Sentiment Score — basierend auf den Sozialen 
Medien — betrachtet. Ein Vergleich der Ergebnisse der verschiedenen Studien 
verdeutlicht, dass die jeweils gewählten Schlagwörter bei der Berechnung des 
Sentiments eine sehr große Rolle spielen. Die Schlagwörter, die mit den Fra- 
gen aus den Konsumentenbefragungen hergeleitet werden können, liefern 
eine höhere Korrelation. Außerdem ist es bei der Berechnung des Sentiments 
wichtig, wie der Sentiment Score definiert wird. Überwiegend verwendeten die 
veröffentlichten Studien bisher für die Berechnung des Sentiment-Scores, die 
Prozentsätze der Wörter mit negativen und positiven Sentiments, die im Text- 
korpus für die Sentimentanalyse zur Verfügung stehen. Als Alternative ließen 
sich in Zukunft Sentiment-Wörterbücher einsetzen, solange die Lexika mit den 
kodierten Werten für die Wörter, wie zum Beispiel Adjektive und Adverbien, zur 
Verfügung stehen. Diese Adjektive und Adverbien und einige für das Sentiment 
relevante Nomen und Verben werden dann mit Zahlen bewertet, die im Interva- 
ll von [-1, 1] liegen, um die Sentiment-Wörterbücher zu bilden. 


® Näheres zur Sentimentanalyse ist in dem Beitrag von Sturm (2021) zu finden. 
? Liu (2015). 
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Tab.1: Studien mit Textdaten aus Sozialen Medien, Foren und Blogs 
SCHLAGWORTER 
AUTOREN ZIEL METHODE / ERGEBNISSE 
LAND 
Salampasis/ | Ansichten der Sentimentanalyse (lexi-| 35 verschiedene Die Stimmung der Kon- 
Paltoglou / Konsument:innen zu__| konbasiert)—taglicher |Lebensmittelprodukte |sument:innen gegen- 
Giahanou Produkten und Marken | Prozentsatz der nega- | und -marken, wie über einem Produkt 
(201) analysieren tiven, positiven oder „McDonalds“, „milk“, ändert sich kurzfristig 
neutralen Stimmung | „seafood“ nicht, sofern es keinen 
bei den Twitter-Daten triftigen Grund gibt. 
Daas / Puts Zusammenhang Sentimentanalyse, Tweets, Face- Textbasiertes 
(2014) zwischen dem um- Korrelation, Gran- book-Posts, Blog- Stimmungsmaß ist 


frage- und Social-Me- 
dia-basierten Konsu- 
mentenvertrauen in 
den Niederlanden 


ger-Kausalitätsanalyse, 
Kointegrationanalyse 


einträge aus den 
Niederlanden. Schlag- 
wörter: „economy“, 
„job“, „jobs“, „consu- 
mer“, „confidence“, 
„finance“, „spending“, 
Personalpronomen auf 
Niederländisch und 
Englisch 


hoch korreliert und 
kointegriert mit dem 
offiziellen Konsumen- 
tenvertrauensindex. 


O'Connor et al. 
(2010) 


Vergleich von 
Umfragewerten (fiir 
Konsumentenvertrau- 
en und US-Wahlen) 
mit der Stimmung in 
Twitter-Daten. 


Sentimentanalyse (lexi- 
konbasiert) — positive 
und negative Werte 
der Worter. 


Konsumentenvertrau- 
en: „economy“, „job“, 
„jobs“ 


Wahlen: „obama, mc- 
cain“ zwischen 2008 
und 2009 


Ab Mitte 2009 kann 
Stimmung aus 
Textnachrichten das 
Konsumentenvertrau- 
en besser voraussagen 
als vorher. 


Pekar / Binner 
(2017) 


Modellierung von Kon- 
sumausgaben anhand 
von Kaufabsichten in 
Social Media 


saisonale ARIMA, 
AdaBoost, 
Gradientenverstar- 
kung, 

Word2vec 


Tweets mit den Kom- 
binationen von (,l“, 
„we“), („will“, „1“, „be 
going to“, „be looking 
to“, „want to“, „wanna“, 
„gonna“), („buy“, „shop 
for“, „get oneself“) aus 


den USA 


Verbesserung der 
Prognosegenauigkeit 
um 11% bis 18 %. 


Shayaaetal. |Analyse des Kaufver- |Sentimentanalyse, Kurznachrichten schwache Korrelation 
(2017) haltens der Konsu- überwachtes maschi- |aus Twitter, Foren, zwischen der textba- 
ment:innen in Malay- | nelles Lernen, Mainstream-Medien, |sierten Stimmung und 
sia via Social Media Korrelationsanalyse Blogs, Facebook und |dem umfragebasierten 
Onlinekommentare Konsumentenvertrau- 
beim Kauf von Com- |ensindex 
putern und Telefonen 
2015bis 2016. 
Shayaaetal. |Zusammenhang zwi- |Sentimentanalyse, Tweets von 2015 bis Schwache Korrela- 
(2018) schen dem Konsumen- | Korrelationsanalyse 2019, die die Wörter tion zwischen der 
tenvertrauensindex „car“ oder „holiday“ Textbasierten und 
in Malaysia und der auf Englisch und Mal- |der umfragebasierten 
Stimmung aus Social aysisch beinhalten. Stimmung. 
Media 
Conradetal. |Zusammenhang Korrelationsanalyse, | Tweets vom 1. Januar |Die Ergebnisse in 
(2019) zwischen dem Univer- | Kointegration 2007 bis zum 27. Juni |(O’Connor u. a. [2010]) 


sity of Michigan Index 
zum Konsumenten- 
vertrauen (ICS) und 
der Stimmung aus 
Twitter-Daten 


2014 aus den USA,, 
die das Wort „jobs“ 
beinhalten 


können ab 2011 nicht 
repliziert werden. 
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Abb.2: Standardisierter Konsumentenvertrauensindex (CCI) in Deutschland 
Quelle: https://stats.oecd.org und Standardisiertes Sentiment aus Social Media in Deutschland, 
April 2019 bis April 2020. Quelle: Eigene Berechnungen. 


Abbildung 2 zeigt, wie gut die Bestimmung des Konsumentenvertrauens an- 
hand von Kurznachrichten aus Social Media sein kann, wenn das Sentiment mit 
Hilfe eines Sentiment-Worterbuchs berechnet wird. Ziele der Analyse, die Ab- 
bildung 2 zugrunde liegt, sind die Berechnungen des Social-Media-Sentiments 
der Konsument:innen und dessen Vergleich mit dem umfragebasierten Konsu- 
mentenvertrauensindex in Deutschland. Dabei wurde das Social-Media-Senti- 
ment mit der lexikonbasierten Sentimentanalyse ermittelt. Fur die Sentimen- 
tanalyse wurden die wirtschaftlich relevanten Kurznachrichten aus Twitter in 
der Zeit vom April 2019 bis zum April 2020 mittels dem Sentiment-Worterbuchs 
SentiWS?° für die deutsche Sprache analysiert. Insgesamt standen für diesen 
Zeitraum rund 502.743 Tweets zur Verfügung. Die ersten Ergebnisse haben ei- 
nen Korrelationskoeffizienten von 0,83 zwischen dem Sentiment aus Social Me- 
dia und dem umfragebasierten Konsumentenvertrauensindex ergeben. Dieses 
vielversprechende Ergebnis kann natürlich bekräftigt werden, wenn historische 


1° Remus/Quasthoff/Heyer (2010). 
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Tweets für Forschungszwecke zur Verfügung stehen. Standardmäßig steht lei- 
der momentan nur 1% der gesamten Tweets kostenlos zur Verfügung, und es 
ist nicht möglich Tweets die älter als 9 Tage sind. Allerdings gewährt Twitter 
seit einigen Monaten auf Antrag für Forschungszwecke kostenlos einen vollen 
Zugang zum Twitter-Archiv. Mit diesem akademischen Zugang ist es möglich, 
pro Antrag bis zu 10 Millionen Tweets monatlich zu scrapen. 


Google Trends und Konsumentenverhalten 


Google Trends" liefert seit 2004 „einen Zeitreihenindex vom Volumen der 
Suchanfragen, die die Nutzer:innen in einem bestimmten geografischen Gebiet 
bei der Onlinesuchmaschine Google eingeben“. Die Berechnung dieser Zeitrei- 
henindizes erfolgt basierend auf den Suchanfragen je nach Bedarf jährlich, mo- 
natlich, wöchentlich und/oder täglich. Der Zeitpunkt mit den meisten Suchan- 
fragen wird dem Wert 100 zugeordnet. Dies bedeutet wiederum, dass sich die 
historischen Indexwerte mit der Zeit ändern können. 

Bei Google Trends werden für 605 Hauptkategorien!? und insgesamt für 
1426 Unterkategorien aggregierte Indizes, die auf den Suchanfragen basieren, 
veröffentlicht. Allerdings kann es vorkommen, dass nicht für jede Kategorie ein 
Index in einem geografischen Gebiet kalkuliert wird, da in einigen Kategorien 
Suchanfragen fehlen können. Darüber hinaus ist zu berücksichtigen, dass die 
aggregierten Indizes ohne Bereinigung der saisonalen Schwankungen berech- 
net werden. 

Da in den letzten Jahren die Konsument:innen zunehmend ihre Einkäufe 
und Preisvergleiche zunehmend via Internet durchführen, können Suchanfra- 
gen für Waren und Dienste bei den Suchmaschinen eine alternative Datenquel- 
le werden, um private Konsumausgaben zu prognostizieren. 


"vgl. https://trends.google.com/trends/. 
12 Choi/Varian (2012). 


33 Hauptkategorien sind Unter anderem Autos und Fahrzeuge, Beruf und Ausbildung, Bücher und 
Literatur, Computer und Elektronik, Essen und Trinken, Finanzen, Gesetz und Regierung, Gesundheit, 
Haus und Garten, Haustiere und wild lebende Tiere, Hobby und Freizeitbeschäftigungen, Immobilien, 
Internet und Kommunikation, Kunst und Unterhaltung, Mensch und Gesellschaft, Nachrichten, Na- 
turwissenschaften, Online-Communitys, Referenz, Reisen, Schönheit und Fitness, Shopping, Spiele, 
Sport, Unternehmen und Industrie. 
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Neben der Erstellung von Prognosen können Daten aus Google Trends 
auch helfen, die Gegenwart besser zu verstehen.“ Zum Beispiel ist es mit Hilfe 
der Daten aus Suchmaschinen möglich, unter anderem Influenzawellen?, In- 
flationserwartungen!®s, Arbeitslosigkeitsrate!” beziehungsweise Anträge auf Ar- 
beitslosigkeit!®, Autoverkäufe!?, Hausverkaufe?°, Zahl der Museumsbesucher?!, 
Hauspreise??, Einnahmen von Kinofilmen? und Bruttoinlandsprodukt?* zu pro- 
gnostizieren. 

Im vorliegenden Beitrag liegt das Hauptaugenmerk auf dem Einsatz von 
Google-Trends-Daten um Konsumentenvertrauen- und Entscheidungen sowie 
privaten Konsum vorauszusagen. Um den privaten Konsum in den USA zu pro- 
gnostizieren,?> wurden 56 wirtschaftlich relevante Google-Trends-Kategorien 
herauskristallisiert. Die Vorhersagemodelle basieren dabei auf der Erkennt- 
nis, dass der Konsumentenvertrauensindex den privaten Konsum in den USA 
erklären kann.” Anhand einer Faktorenanalyse wird die Zahl der Kategorien 
reduziert und die geschätzten Faktoren fließen anschließend in die Vorher- 
sagemodelle ein. Die Ergebnisse zeigen, dass die Modelle, in denen die Fakto- 
ren aus den Google-Trends-Daten als erklärende Variable zusammen mit den 
für die Konjunktur relevanten makroökonomischen Variablen (das heißt reales 
persönliches Einkommen, S&P-500-Aktienmarktindex, Dreimonatszinssatz) 
auftauchen, bessere Prognosen liefern als die Baseline-Modelle. Hier muss auch 
darauf hingewiesen werden, dass die Studie den Zeitraum zwischen 2005 und 
2009 betrachtet hat. 


14 Choi/Varian (2009b); Choi/Varian (2009a), (2009b), (2012). 
Ginsberg et al. (2009). 

16 Guzman (2011). 

7 D’Amuri/Marcucci (2009); Askitas/Zimmermann (2009). 

18 Choi/Varian (2009a). 

19 Choi/Varian (2009b); Choi/Varian (2012); Carriére-Swallow/Labbé (2013). 
2° Choi/Varian (2009b); Choi/Varian (2012). 

21 Volchek et al. (2018). 

22 Wu/Brynjolfsson (2015). 

22 Asur/Huberman (2010). 

24 Liu/Xu/Fan (2018); Qian (2018). 

25 Vosen/Schmidt (2011). 

2° Wilcox (2007), Ludvigson (2004); Carroll/Fuhrer/Wilcox (1994). 
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In einer anderen Studie zur Prognose des privaten Konsums in den USA 
wurden neben den finanziellen Variablen wie S&P-500-Aktienmarktindex oder 
kurzfristige (Dreimonats) und langfristige (Zehnjahres)Zinssätze lediglich 25 
Google-Trends-Kategorien benutzt.?” Obwohl diese Studie nur den Zeitraum 
zwischen 2007 und 2009 analysiert, haben die Ergebnisse mit den Faktoren aus 
den Google-Trends-Kategorien wieder eine bessere Voraussage geliefert. 

Ähnliche Ergebnisse mit Google-Trends-Daten wurden in einer anderen 
Studie auch für den Konsum in Deutschland erzielt.28 Dabei wurden lediglich 41 
Google-Trends-Kategorien benutzt und die Daten aus der Zeit von 2004 bis 2010 
analysiert. Basierend auf diesen Erkenntnissen wird beim RWI- Leibniz-Institut 
für Wirtschaftsforschung der RWI-Konsumindikator?? berechnet. Dem Institut 
zufolge weist der „RWI-Konsumindikator gegenüber dem privaten Verbrauch 
einen Vorlauf von einem Quartal“?° auf. 

In einer aktuelleren Studie?! fungierten 66 konsumrelevante Goo- 
gle-Trends-Kategorien zusammen mit den nachrichtenrelevanten Goog- 
le-Trends-Daten?? als erklärende Variablen, um die Veränderung des privaten 
Konsums in den USA zu prognostizieren beziehungsweise in Echtzeit vorauszu- 
sagen (Nowcast33). Dabei wurden „recession“ und „layoff“ als Suchwörter für die 
nachrichtenrelevanten Google-Trends-Daten benutzt. Die Analyse, basierend 
auf den monatlichen Daten für den Zeitraum zwischen 2009 und 2014, hat ge- 
zeigt, dass die nachrichtenrelevanten Google-Trends-Daten für die Veränderung 
des Konsums von Gebrauchsgütern nützlich sein können und die Modelle mit 
den konsumrelevanten Google-Trends-Kategorien Konsumabsichten erklären 
können. Darüber hinaus können konsum- und nachrichtenrelevante?* Goog- 
le-Trends-Daten zusammen die Prognosegüte verbessern und dabei helfen, den 
Konsum einen Monat im Voraus zu prognostizieren. 

In einer Studie mit zwei Google-Trends-Kategorien (das heißt „motorcyc- 
le“, „birth control“) ließ sich die Voraussage des Konsumentenvertrauensindex 


27 Kholodilin/Podstawski/Siliverstovs (2010). 
28 Vosen/Schmidt (2012). 


2° RWI (2010), $.103. Online abrufbar unter https://www.rwi-essen.de/forschung-und-beratung/ 
wachstum-konjunktur-oeffentliche-finanzen/projekte/221/. 


3° RWI-Konsumindikator, https://www.rwi-essen.de/konsumindikator 

31 Woo/Owen (2019). 

32 Google Trends, https://trends.google.de/trends/explore?cat=16&date=all_ 2008&gprop=news. 
33 Näheres zu „Nowcasts“ ist in dem Beitrag von Maaß (2021) zu finden. 

34 Google Nwes, https://news.google.com. 
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in Sri Lanka im Vergleich mit einem autoregressiven Prozess erster Ordnung 
um 5,2 % verbessern.” Diese zwei Google-Trends-Kategorien wurden mit Hil- 
fe der Spike-und-Slab-Regression unter Berücksichtigung der insgesamt 1104 
Google-Trends-Kategorien für die Zeit vom September 2012 bis zum April 2017 
bestimmt. 

Google-Trends-Daten werden auch verwendet, um Konsumentenent- 
scheidungen und -verhalten fur Mode vorauszusagen. In einer Studie wird zum 
Beispiel Google-Trends-Serie für die Suchanfrage „Burberry“ mit verschiedenen 
Modellen geschätzt.36 Die Prognosegüte des bereinigten („enoised“) neurona- 
len Netzwerk-Modells (DNNAR) wird dabei mit den Prognosen, basierend auf 
den konventionellen Zeitreihenmodellen wie ARIMA, exponentielle Glättung 
oder ARMA mit saisonalen Trends, verglichen. Der Vergleich ergibt, dass das 
DNNAR-Modell bessere Ergebnisse liefert als die anderen Modelle. Allerdings 
weisen die Autoren darauf hin, dass die Google-Trends-Daten für die moderele- 
vanten Suchanfragen hohe saisonale Schwankungen zeigen, wodurch die Prog- 
nosen für die moderelevanten Suchanfragen mit wenigen saisonalen Schwan- 
kungen schwer vorherzusagen wären. 


Schlussfolgerungen 


Textdaten aus Sozialen Medien bergen große Chancen und Herausforderungen 
für die Praxis. Die ersten vielversprechenden Ergebnisse zeigen, dass die Senti- 
ment Scores, die auf der Basis von Kurznachrichten aus Sozialen Medien berech- 
net worden sind, in der Zukunft die umfragebasierten Konsumentenvertrau- 
ensindizes ersetzen können. Da die Durchführung und Analyse von Umfragen 
viel Zeit und Geld kostet, können durch die Nutzung von Textdaten aus Sozialen 
Medien viel Zeit und Ressourcen gespart werden. Eine der größten Herausfor- 
derungen dabei ist die Auswahl der richtigen Such- und Schlagwörter für die 
Praxis. Eine mögliche Lösung dafür könnte der Einsatz von Algorithmen bezie- 
hungsweise künstlicher Intelligenz sein. Dabei müssen die Algorithmen mit Da- 
ten zunächst trainiert werden. Mit der Zeit können die Algorithmen durch den 
Lerneffekt verbesserte Prognosen liefern. 

Die Nützlichkeit von Google-Trends-Daten unter anderem zu Voraussage 
von Konsumentscheidungen hat sich schon längst erwiesen. Dennoch könnten 


33 Zhang (2017). 
36 Silva et al. (2019). 
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die Prognosen verbessert werden, indem die Daten von Onlinesuchanfragen 
und Textdaten aus Sozialen Medien zusammen in die Analyse einfließen. Es 
gibt schon einige erste Versuche in dieser Richtung.?’ Um beispielsweise die Au- 
toverkäufe in Deutschland vorauszusagen, wird das Suchverhalten der Verbrau- 
cher:innen mit der Stimmung der Verbraucher:innen in Bezug auf eine Marke 
oder ein Produkt kombiniert.?® Die Ergebnisse der Analyse haben gezeigt, dass 
die Modelle mit Google-Trends- und Twitter-Daten bessere Prognosen liefern 
als die Modelle, die nur Suchanfragedaten oder Textdaten aus Sozialen Medien 
verwenden. 

Es muss hier auch noch einmal betont werden, dass Google-Trends-Da- 
ten sich mit der Zeit ändern können — mit entsprechenden Rückwirkungen auf 
die Berechnung von Indexwerten für einen bestimmten Zeitpunkt. Dies wie- 
derum macht die Replizierbarkeit der Studien schwierig. Darüber hinaus wur- 
den in den Studien wegen der hohen Saisonalität, die Google-Trends-Daten in 
Wachstumsraten umgewandelt, um saisonale Schwankungen zu eliminieren. 
Da mittlerweile längere Zeitreihen zur Verfügung stehen, wird es bald möglich 
sein, Google-Trends-Daten mit den konventionellen Methoden wie X12-ARIMA 
oder X-13-ARIMA-SEATS saisonal zu bereinigen. Dies wird eine einfachere Inter- 
pretation der Ergebnisse ermöglichen. 

Die Wahl der richtigen Schlagwörter und Kategorien ist für die Analyse 
mit Google-Trends-Daten sehr wichtig. In einigen Studien wurde vorgeschla- 
gen, Google Correlate zu nutzen, um die richtigen Schlagwörter zu finden.?9 Bei 
Google Correlate ist es möglich, anhand einer Zeitreihe einige relevante Goog- 
le-Trends-Kategorien oder Unterkategorien zu bekommen. Diese vorgeschlage- 
nen Google-Trends-Kategorien haben schlussendlich einen ähnlichen Verlauf 
wie die Zeitreihe, die analysiert werden soll. Allerdings können sich dabei Such- 
wörter ergeben, zu denen lediglich ein begrenzter ein Zusammenhang herge- 
stellt werden kann. Daher ist es wichtig, die Ergebnisse herauszufiltern und mit 
Vorsicht zu interpretieren. 

Eine weitere Möglichkeit wäre die Nutzung von Google-Analytics-Daten, 
die keine Indexdaten sind. Mit deren Hilfe wäre es möglich, replizierbare Ana- 
lysen durchzuführen. 


37 Skodda/Benthaus (2015). 
38 Ebenda. 


3? Sawaengsuksant (2018). 
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Implizite Motive in der politischen Kommunikation 


Niklas Scheffer, Silke Sturm und Zahurul Islam 


Einleitung 


Lange galt in der politischen Okonomie der Homo Oeconomicus als theore- 
tischer Ausgangspunkt. Demnach orientieren sich Wahler:innen bei ihrer 
Stimmabgabe an der ideologischen Distanz zwischen sich selbst und den Par- 
teien. Der geringste Abstand im euklidischen Raum entscheidet über die Allo- 
kation der Stimmen und den Wahlerfolg. Psychologische Beiträge zeigen, dass 
die Rationalitätsannahmen des Homo Oeconomicus gerade in der politischen 
Entscheidungsbildung nicht haltbar sind. So stellen etwa die Darstellung und 
Präsentation von Informationen einen relevanten Faktor in der Entscheidungs- 
findung dar. Schnellenbach und Schuber stellen die wachsende Bedeutung 
verhaltensökonomischer und psychologischer Ansätze in der politischen Öko- 
nomie heraus.! Rein rationale Kosten-Nutzen-Erwägungen können das Kom- 
munikations- und Wahlverhalten nicht erklären, emotionale oder scheinbar ‚„ir- 
rationale“ Bestandteile scheinen einen erheblichen Einfluss auf Wähler:innen 
und Politiker:innen zu haben. 

Der vorliegende Beitrag konzentriert sich auf diesen unbewussteren Aspekt. 
Soziale Medien bieten die einmalige Möglichkeit, die Interaktion von Parteien 
und Wahler:innen zu analysieren. Es werden mit über maschinelles Lernen trai- 
nierten, Algorithmen mehr als 30.0000 Facebook-Posts der im deutschen Bun- 
destag vertretenen Parteien hinsichtlich der drei grundlegenden emotionalen 
beziehungsweise impliziten Motivdimensionen Macht, Bindung und Leistung 
analysiert. Der Einbezug von Motivmustern erlaubt es, konkrete Rückschlüsse auf 
eine politische Orientierung der Handelnden zu treffen, die rational nicht erklär- 


1 Schnellenbach/Schubert (2015). 
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bar erscheint, sondern eher emotional bedingt wirkt. So haben Studien von Win- 
ter? ergeben, dass ein bestimmtes Motivmuster — Macht hoch und Bindung tief 
— Krisen oder sogar kriegerische Auseinandersetzungen, die allen rationalen Kos- 
ten-Nutzen-Erwägungen widersprechen, ankündigt und damit prognostizierbar 
macht. Es ist von Erkenntnisinteresse, wie Parteien und Politiker:innen mit ihren 
Wahler:innen abseits rationaler Logik kommunizieren und ob sich emotional ver- 
ankerte Motivmuster bestimmten Parteien zuordnen lassen. 

Neben den Motivdimensionen werden die Mitteilungen nach den grundle- 
genden Themenschwerpunkten innerparteilicher Kommunikation und politik- 
relevanter Kommunikation auf der Basis eines unüberwachten Topic-Modells 
unterschieden. Ziel der Analyse ist es, durch die Kombination der Messmetho- 
den zu interpretierbaren und für weitere Untersuchungen relevanten Ergebnis- 
sen zukommen. 

Im folgenden Beitrag werden die „großen drei“ impliziten Motive darge- 
stellt und ihre Messung erläutert. Danach werden der Algorithmus und das 
maschinelle Lernen vorgestellt. Im nachfolgenden Abschnitt werden die zu- 
grundeliegenden Daten und die Hypothesen beschrieben. Der anschließende 
Abschnitt widmet sich den Interpretationsmöglichkeiten und der politischen 
Relevanz der Ergebnisse. Der Beitrag schließt mit einer Diskussion. 


Implizite Motive 
Die „großen drei” impliziten Motive 


Bereits seit den 1950er-Jahren ist Psycholog:innen bekannt, dass das mensch- 
liche Gehirn über mehrere Systeme zum Wahrnehmen, Verarbeiten und Spei- 
chern von Informationen verfügt, von denen nur ein Bruchteil bewusst von 
uns wahrgenommen wird. Implizite Motive spielen eine große Rolle dabei, wie 
unser Verhalten initiiert, aufrechterhalten und gestoppt wird.* Sie orientieren, 
wählen und aktivieren unser Verhalten vor allem durch emotionale, in alten 
Teilen des Gehirns verankerte Impulse.5 


2 Winter (1993); Winter (2004); Winter (2007). 
? Schultheiss/Brunstein (2010), S. xv. 

* McClelland (1999). 

° Schultheiss/Brunstein (2010). 
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Ein Motiv lasst sich als eine stabile individuelle Disposition definieren, auf 
bestimmte Anreize in unserer Umwelt emotional besonders stark zu reagieren.® 
Eine Person mit einem besonders ausgeprägten Motiv richtet ihr Verhalten da- 
nach aus, bestimmte Reize direkt zu suchen (oder zu vermeiden), um durch ihre 
Reaktion auf sie Befriedigung zu erreichen.” Kein Motiv operiert dabei über die 
gesamte Zeit, sondern wird immer nur durch bestimmte Anreize oder Ziele 
aktiviert. Individuen unterscheiden sich aber darin, wie schnell sie durch ein 
bestimmtes Motiv angesprochen werden. Motive sind somit sowohl stabile 
individuelle Persönlichkeitsmerkmale (traits) als auch zeitlich und situations- 
übergreifend variabel (states).® 

Die genaue Zahl der Motive ist umstritten. Während Murrays Motivkata- 
log von 1938 noch fast 20 Motive umfasste, geht heute ein großer Teil der Motiv- 
forschung von drei grundlegenden Dimensionen menschlicher Motivation aus: 
Macht, Bindung und Leistung. Das Machtmotiv wird als das Bedürfnis definiert, 
andere zu beeinflussen, zu kontrollieren oder Wirkung auf eine Person, Gruppe 
oder die ganze Welt zu erzielen.? Das Bindungsmotiv wird als Bedürfnis defi- 
niert, eine positive Beziehung zu einer anderen Person oder Gruppe aufzubau- 
en aufrechtzuerhalten oder wiederherzustellen.!° Das Leistungsmotiv definiert 
sich, durch das Bedürfnis, etwas besser machen zu wollen oder einen gewissen 
Leistungsstandard zu erfüllen." 

Neben diesen drei Motivdimensionen gibt es auch Bedürfnisse wie Hun- 
ger, Durst, Hygiene, Sex, Durchsetzung, Integration, Sicherheit und Erkenntnis, 
die teilweise aber starke Überlappungen mit den „großen drei“ Motiven aufwei- 
sen. Die Reduktion auf drei grundlegende Motive dient daher vor allem dem 
Zweck, mit möglichst wenigen Motiven Verhalten und dessen Änderungen 
möglichst vollständig erklären zu können.!? Wie der größte Teil der Motivfor- 
schung legt sich auch der Datensatz, der diesem Beitrag zugrunde liegt, auf diese 
drei Basismotive fest. 


6 Winter (2007). 

7 Schultheiss/Brunstein (2010). 

8 Winter (2007). 

>? Ebenda. 

1° Pang (2010). 

“McClelland (1999). 

12 McClelland (1999); Schultheiss/Brunstein (2010). 


176 Niklas Scheffer, Silke Sturm und Zahurul Islam 


Messung der impliziten Motive 


Der erste Psychologe, der den Versuch unternahm, die Motivforschung zu syste- 
matisieren, war 1935 Henry A. Murray. Angelehnt an die Freud‘sche Methode der 
freien Assoziation, entwickelte er den Thematic Apperception Test (TAT). Murray 
ersetzte die spontaneren und unstrukturierteren Ergebnisse, die Freud durch sei- 
ne Patient:innen erhielt, durch einen standardisierten Satz mehrdeutiger Bilder. 
Jedes der 20 Bilder sollte ein bestimmtes Motiv hervorrufen. Nach dem Betrach- 
ten der Bilder wurden die Probanden aufgefordert, sich kurze Geschichten aus- 
zudenken und diese niederzuschreiben. Die Geschichten wurden anschließend 
hinsichtlich einer feststehenden Anzahl von beinahe 20 Motiven ausgewertet. 

Auf Atkinson und McClelland geht die erste streng empirisch konzipierte 
Studie in der Motivforschung zurück." Bei einer Versuchsgruppe wird zunächst 
gezielt ein bestimmtes Motiv angeregt, danach wird die Gruppe aufgefordert, 
das TAT-Testformular auszufüllen. Die TAT-Ergebnisse der aktivierten Versuchs- 
gruppe werden anschließend mit den Ergebnissen einer Kontrollgruppe vergli- 
chen, bei der das Motiv nicht angeregt wurde. Mit dieser Methode legten Atkin- 
son und McClelland die Grundlage für die Messung von Motiven. Die Ergebnisse 
konnten mit verschiedenen Studien nach dem gleichen Studiendesign bestä- 
tigt werden.1¢ In späteren Studien zeigte sich, dass die Motive zwar situativ va- 
riieren, aber grundsätzlich zeitstabil in den TAT-Ergebnissen zu erkennen sind. 
Schlussfolgerung ist, dass es sich bei Motiven um zeitübergreifende Persönlich- 
keitsmerkmale handelt.’ 

Die Analysen wurden in der zweiten Hälfte des 20. Jahrhunderts auf eine 
kollektive, gesellschaftliche Ebene angewendet.!8 Es konnte dabei gezeigt wer- 
den, dass die „großen drei“ Motive auch auf kollektiver Ebene Erklärungswert 
besitzen. Für das Leistungsmotiv konnte etwa ein Zusammenhang zwischen 
leistungsbezogenen Inhalten in Schulbüchern und späterem Wirtschaftswachs- 
tum nachgewiesen werden.!? Winter konnte für die Zeit zwischen 1603 und 1988 


3 Murray (1943); Weinberger/Cotler, Tanya, Fishman, Daniel (2010). 
14 McClelland (1999). 

8 McClelland/Atkinson (1948). 

16 Shipley Jr. / Veroff (1952); Steele (1977). 

17 Fodor (2010). 

18 McClelland (1961). 

1 Ebenda. 
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ein kollektives Motivmuster, hohes Machtmotiv und niedriges Bindungsmotiv, 
in Großbritannien jeweils ein Jahr vor Kriegseintritt nachweisen.?° Fur politi- 
sche Krisen lässt sich das gleiche Motiv-Inhaltsmuster für die Kommunikation 
politischer Entscheidungsträger:innen zeigen.?! 

Die Ergebnisse zeigen eine breite Anwendbarkeit der Motivforschung. 
Weitere Studien legen überzeugend die Möglichkeit dar, über inhaltsanalyti- 
sche Methoden konkrete Verhaltensmuster von Individuen und Kollektiven zu 
prognostizieren. 


Politische Ökonomie 


Der Ausgangspunkt des rationalen Wahlers nach Downs??, der unter der Ratio- 
nalitätsannahme und der Annahme vollständiger Information, eine seinen Nut- 
zen maximierende Entscheidung trifft, führt im eindimensionalen Raum zur Kon- 
vergenz politischer Parteien.?3 Die diesem Modell zugrundeliegenden Annahmen 
von Invarianz, Vollständigkeit aller Informationen, Eindimensionalität des Poli- 
tikraums und dem Eigennutzaxiom wurden im Laufe der Zeit stark kritisiert.?* 

Kahneman und Tversky/Kahneman zeigen, dass Framing von identischen 
Informationen, also die Kontextualisierung, die Entscheidungen von Agent:in- 
nen beeinflusst.25 Bezogen auf den rationalen Wähler können die strengen Ra- 
tionalitätsannahmen widerlegt werden. Menschen unterliegen kognitiven Ver- 
zerrungen, die ihre Entscheidungsfindung unbewusst beeinflussen.?® 

Cowen kritisiert die Axiome des Downs‘schen Wählers von Rationalität 
und vollkommenen Informationen aus einer verhaltensökonomischen Pers- 
pektive.2” Er argumentiert, dass jeder Mensch vorgefestigte Überzeugungen 
(„biases“) in sich trägt, welche ihn unbewusst daran hindern, rationale Entschei- 
dungen zu treffen. Die meisten Menschen sind davon überzeugt, die Wahrheit 


2° Winter (1993). 

21 Winter (2004); Winter (2007). 

22 Downs (1957). 

23 Herz/Weinberger (2019). 

24 Bénabou/Tirole (2016); Caplan (2011); Cowen (2005); Kahneman (2003); Tversky/Kahneman (1986). 
25 Kahneman (2003); Tversky/Kahneman (1986). 

26 Simon/Fassnacht (1982). 

27 Cowen (2005). 
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zu kennen, und hinterfragen diese auch dann nicht, wenn ihnen Personen mit 
einer offensichtlich größeren Expertise, dieser widersprechen.?® Erhalten Men- 
schen Informationen, die nicht mit ihrem Selbstbild übereinstimmen, so ver- 
werfen sie diese oder interpretieren sie so, dass ihre vorherigen Glaubenssätze 
sogar noch gestärkt werden.?? Cowen schließt aus diesen Erkenntnissen, dass 
politische Kommunikation und Informationsaustausch in Demokratien, entge- 
gen der Annahme von Downs (1957), nicht zu einer Konvergenz der Meinungen, 
sondern zu einer vertieften Polarisierung tendiert.?° 

Benabou und Tirole weisen darauf hin, dass kognitive Verzerrungen und 
systematische Selbsttäuschung wichtige psychologische und funktionale Be- 
dürfnisse des Einzelnen erfüllen.?! Beispiele sind das Vertrauen in die eigenen 
Fähigkeiten, das moralische Selbstwertgefühl, die Verringerung von Angst, die 
soziale Identität, die politische Ideologie und der religiöse Glaube. Dieser Befund 
wird auch von der Forschung unterstützt. So haben mehrere Studien ergeben, 
dass sich selbstüberschätzende und selbsttäuschende Personen glücklicher 
sind als Personen, die ein weniger hohes Maß an Selbsttäuschung aufweisen. In 
der Tat ist eine hohe Objektivität bei der Verarbeitung von Informationen sogar 
eher ein Anzeichen für eine Depression.3? 

Zusammengefasst sind verhaltensökonomische Ansätze in der Pub- 
lic-Choice-Literatur zunehmend relevant. Die im vorherigen Abschnitt ange- 
sprochenen impliziten Motive wurden im politischen Kontext von Winter nach- 
gewiesen. Sie lassen sich als intra- und interindividuell wirksame „frames“ 
beziehungsweise „biases“ interpretieren. Die Motive werden im vorliegenden 
Beitrag zur Erklärung angebotsseitiger politischer Kommunikation verwendet. 
Die Herangehensweise trägt eine neue verhaltensökonomische Komponente 
zur Erklärung des Verhaltens politischer Akteur:innen bei. 


28 Caplan (2011). 

2° McCright/Dunlap (2011); Munro/Ditto (1997); Lord/Ross/Lepper (1979). 
30 Cowen (2005). 

31 Bénabou/Tirole (2016). 

32 Korn et al. (2014). 

33 Winter (1993); Winter (2004); Winter (2007). 
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Maschinelles Lernen 


Implizite Motive wurden bis jetzt im TAT oder vergleichbaren Testverfahren von 
Psychologen in zeitaufwendiger Handkodierung erfasst.34 Die Fortschritte com- 
putergestützter Analyseverfahren ermöglichen es heute, geschriebenen Text 
automatisiert auszuwerten. Schultheiss hat auf der Basis des Linguistic Inquiry 
and Word Count (LIWC)3 einen ersten Ansatz dazu vorgelegt. Die Hypothese, 
dass es Marker-Worte für die Motivmessung gibt, konnte bestätigt werden. 

Die Studie basiert allerdings auf einer nur kleinen Stichprobe für Deutsch- 
land und die USA, zudem war die interkulturelle Übereinstimmung nicht über- 
zeugend. Die Daten, welche wir in unserer Studie verwenden, wurden von 
einem Maschinenlernmodell ausgewertet, das aus einer sehr viel größeren 
Stichprobe entwickelt wurde. Die von Johannßen et al. vorgestellte Methode 
nutzt ein überwachtes Lernmodell. Anders gesagt, lernt der Algorithmus, den 
Motivkategorien selbstständig Textmerkmale zuzuordnen?” 

Zum Anlernen eines Algorithmus wurden zwei Trainigsdatensätze ver- 
wendet, die Expert:innen-Auswertungen nach dem Manual von Kuhl zum Ope- 
ranten Motivtest (OMT)38 umfassen; die Testpersonen schreiben jeweils zu 15 
Bildern kurze Geschichten.?® 

Der auf den kodierten OMT-Antworten basierende Trainingsdatensatz 
wurde hinsichtlich der Interpunktion sowie von Funktionswörtern bereinigt. 
Die Vereinfachung der Sprache reduziert das „Rauschen“ sowie die erforderliche 
Rechenleistung. Hierfür wurden die Texte in ihre logischen Einheiten (Tokens) 
zerlegt und Programmier- und Rechtschreibfehler in automatisierter Form eli- 
miniert.*° 

Im folgenden Schritt wurden aus den Trainingsdaten Merkmale gewon- 
nen, von denen ausgehend der Algorithmus die beste Vorhersagekraft entwi- 
ckelt.*! Die Auswertung erfolgt auf der Basis der Bag-of-Words-(BoW)Merkmals- 


34 Kuhl (2013); Winter (1991). 

35 Pennebaker/Francis/Booth (2001). 

3° Schultheiss (2013). 

37 Johannßen et al. (2020). 

38 Kuhl (2013). 

32 Johannßen/Biemann/Scheffer (2019); Johannßen et al. (2020). 
40 Zheng/Casari/Lotze (2019). 

41 Zheng/Casari/Lotze (2019). 
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gewinnung. Die BoW-Methode lost die Ordnung der Texttokens auf und gibt die 
Haufigkeit der Worter innerhalb eines Textes an. Es werden Merkmalsvektoren 
generiert, die die Häufigkeit eines Wortes über alle Dokumente enthalten.*? 

Aus dem durch die Bag-of-Words-Merkmalsgewinnung entstandenen 
Wörterbuch wurde eine Reihe von Merkmalslisten unter Berücksichtigung der 
Schwellenwerte erstellt. Eine Merkmalsliste mit der Frequenz 10 enthält somit 
alle Inhaltswörter, die mindestens zehn Mal in den Trainingsdaten verwendet 
wurden. Um die Klassifikationsgüte einer jeden Merkmalsliste zu bestimmen, 
wurde als Basis ein Naive-Bayes-Klassifikator verwendet. Ziel war es, die Merk- 
malsliste zu ermitteln, die voraussichtlich die höchste Vorhersagekraft besitzt. 

Die vier folgenden Algorithmen wurden getestet: Multinomial Naive Bay- 
es (MNB), Discriminative Multinomial Naive Bayes (DMNB), Support Vector Ma- 
chine (SVM) und Random Forest. Die Zuordnung für den Beitrag erfolgt auf der 
Grundlage des DMNB. In dem überwachten Lernprozess können die Klassifizie- 
rung jeder Instanz und die korrekte Zuordnung überprüft werden. Anhand der 
beobachteten Alpha- und Beta-Fehler werden Maßzahlen zu Präzision, Akku- 
ranz und Rücklauf sowie das Fı-Maß (Validität) errechnet.“ Um Fehler durch zu- 
fälliges Rauschen zu vermeiden, wurden mehrere statistisch unabhängige Da- 
tensätze simuliert, indem eine k-fache Kreuzvalidierung durchgeführt wurde.* 

Für die Daten konnten sehr gute Ergebnisse bezüglich des F-Scores (0,72), 
der Akkuranz (73,41), der Präzision (0,73) und des Rücklaufs (0,73) erzielt wer- 
den. Nach Winter werden die Postings in einzelne Fenstergrößen von 50 
Wörtern zerlegt.” Jedes Fenster wird anschließend anhand des entwickelten 
Maschinenlernmodells nach den Motiven kodiert. Durch ein Aggregieren der 
Ergebnisse für jedes Fenster wird das dominante Motiv für jeden Post kodiert. 
Falls ein Fenster weniger als 50 Wörter enthielt, wurde dieses dem vorherigen 
Fenster hinzugefügt. 

Algorithmen kodieren bei Tests wie dem OMT beinahe genauso zuverläs- 
sig, wie menschliche Experten. Bei den vier getesteten Algorithmen konnten 
immer F-Werte von 0,71 bis 0,73 erreicht werden. Das ist insbesondere deshalb 
beachtlich, weil der Algorithmus in seiner ursprünglichen Fassung nicht nur 
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wie beispielsweise bei Winter vier Kategorien (drei Motive und Null)#8, sondern 
16 Kategorien erfasst. Fur den vorliegenden Beitrag werden nur die besagten 
vier Kategorien verwendet. 


Hypothesenbildung 


Im vorherigen Teil dieses Beitrags wurde dargestellt, dass die lange Zeit in der 
Public Choice vorherrschende Annahme, dass Wahler:innen ihre Stimme nach 
rationalen Kriterien vergeben und diejenigen Politiker:innen oder Parteien 
wahlen, die ihren individuellen Nutzen maximieren, schon seit Langerem als 
veraltet gilt. In Studien konnte nachgewiesen werden, dass bestehende Meinun- 
gen auf der Grundlage von Ideologie, Werten und Erfahrungen die Verarbeitung 
neuer Informationen beeinflussen.“ Zusätzlich unterstützt die Kommunikation 
zwischen Subjekten bestehende Meinungen und Gruppenidentifikationen.®° Es 
ist daher anzunehmen, dass die Art und Weise der politischen Kommunikati- 
on einen Einfluss auf die Verarbeitung durch Wähler:innen hat. Motivmuster 
können als unbewusste Elemente der Kommunikation einen Beitrag zum Ver- 
ständnis der Wirkung politischer Kommunikation auf Wähler:innen liefern so- 
wie den potenziellen Wählerkreis zu ermitteln. 


Hypothese ı 


Motive richten, wählen und aktivieren das Verhalten.5! Sie bewirken, dass wir 
uns auf bestimmte Anreize in unserer Umwelt besonders stark reagieren, auf 
eine zeit- und situationsübergreifende Art und Weise. Eine Person mit einem 
besonders ausgeprägten Motiv richtet ihr Verhalten danach aus, bestimmte Rei- 
ze direkt zu suchen, um durch ihre Reaktion auf sie Befriedigung zu erreichen. 
Im Lauf der letzten 50 Jahre wurden zahlreiche Hypothesen aufgestellt 
und Studien durchgeführt, die den Einfluss der drei Motive auf die Politik oder 
politiknahe Bereiche zum Gegenstand hatten. So haben Studien ergeben, dass 
Politiker:innen mit einem starken Bindungsmotiv in historischen Untersuchun- 


48 Winter (1991). 

49 Le Yaouang (2018); Rabin/Schrag (1999); Sunstein (2001). 
5° Sausgruber/Tyran (2011). 

51 Schultheiss/Brunstein (2010). 
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gen haufiger in politische Skandale verwickelt waren, aber auch die Bereitschaft 
zeigten, in politischen Krisen Konzessionen zu machen, die kriegerische Ausei- 
nandersetzungen verhinderten.? Ein starkes Leistungsmotiv konnte hingegen 
häufig mit einer weniger effizienten Administration infolge von mangelnder 
Delegation und Frustration in Verbindung gebracht werden.*? Charismatische 
Politiker:innen konnten in einer Studie der US-Präsidenten, von Washington 
bis Lyndon B. Johnson, mit einem starken Machtmotiv in Verbindung gebracht 
werden.*4 Existierende Untersuchungen deuten demnach auf ein eindeutiges 
Profilmuster politischer Akteur:innen hin. 

Hypothese 1: Das aggregierte Machtmotiv im Facebook-Datensatz sollte si- 
gnifikant stärker sein als in dem repräsentativ erhobenen Testdatensatz. Das 
Bindungsmotiv sollte signifikant schwächer sein. 


Hypothese 2 


Ein sehr starkes Machtmotiv wird häufig mit dem Bedürfnis zu absoluter Wil- 
lensdurchsetzung und mit einem starken persönlichen Geltungsdrang in Zu- 
sammenhang gebracht. Im politischen Kontext kann der Zusammenhang zwi- 
schen einem Hang zum Autoritären und einem übersteigerten Machtmotiv 
in Kombination mit einem schwach ausgeprägten Bindungsmotiv beobachtet 
werden. Im demokratischen Kontext taucht die Motivkombination deutlich 
seltener auf.5¢ 

Die AfD wird auf der Grundlage von ausgewerteten Reden, Medienbeiträ- 
gen sowie weiterer Kommunikation mit einer rechtsautoritären Ausrichtung 
assoziiert.” Beispiele finden sich unter anderem in Buchveröffentlichungen?® 


52 Weinberger/Cotler/Fishman (2010); Winter (2010). 
53 Winter (2010). 
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und Reden der Parteivorsitzenden??. Häusler verortet die AfD in einem völ- 
kisch-autoritaren Populismus.®° 

Die Verortung der AfD als autoritare Partei sollte, der Theorie folgend, ein 
signifikant starkeres Machtmotiv und ein schwacheres Bindungsmotiv in der 
Kommunikation sichtbar machen. Sowohl interne Machtkampfe als auch die 
Auseinandersetzung mit politischen Gegnern unterstutzen die Hypothese. 

Hypothese 2: Die AfD sollte ein signifikant starkeres Machtmotiv aufweisen 
als die weiteren Parteien im Datensatz. Das Bindungsmotiv sollte signifikant 
schwächer sein. 


Hypothese 3 


Die Kommunikation der Parteien unterscheidet sich nach politischer und par- 
teiinterner Kommunikation. Die parteiinterne Kommunikation enthält vor 
allem positive und gemeinschaftliche Aspekte, aber auch Konflikte innerhalb 
der Partei. Die politische Kommunikation hingegen erfordert die Auseinander- 
setzung mit externen Themen sowie mit politischen Gegnern. Die Kommuni- 
kation unterscheidet sich grundsätzlich je nach Zielpublikum und Zielsetzung. 
Außer in Fällen starker innerparteilicher Konflikte und Machtkämpfe ist die 
parteiinterne Kommunikation eher durch Einigkeit und Fakten (Termine, Wahl- 
erfolge) geprägt. 

Die Auseinandersetzung mit dem politischen Gegner über die Positionie- 
rung erfordert eine kritischere Kommunikation. Im Gesamtspektrum der po- 
litischen Akteur:innen herrscht bei der politischen Kommunikation weniger 
Einheit. 

Hypothese 3a: Die parteiinterne Kommunikation sollte signifikant schwa- 
cher mit dem Machtmotiv kodiert sein als die parteiexterne Kommunikation. 

Für das Erstarken der AfD gibt es verschiedene Erklärungsansätze. Zwei 
dieser Theorien sind für die strategische Wähleransprache relevant. Eine pro- 
minente Theorie findet sich in der , Modernisierungsverliererhypothese“.®! Sie 
besagt, dass durch wirtschaftliche Ängste im Zuge der fortschreitenden Globa- 
lisierung rechtspopulistische Tendenzen gestärkt werden. Die Auswirkungen 


5 Die Welt (11.9.2016); Frankfurter Allgemeine Zeitung (17.5.2018). 
6° Häusler (2018b); Häusler (20183). 
61 Lengfeld (2017); Rippl/Seipel (2018). 
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sind in Bevolkerungsgruppen mit geringerem Humankapital und in Peripherie- 
gegenden starker; aber auch ein Teil der Mittelschicht, welche sich Sorgen um 
ihren wirtschaftlichen Abstieg macht, sei betroffen. Eine weitere These ist die 
„Cultural Backlash“-Theorie.® In dieser These werden weniger wirtschaftliche 
denn sozialpsychologische Gründe als ursächlich angesehen. Zusammengefasst 
wird angenommen, dass sich ein Teil der Bevölkerung von dem liberalen Wand- 
lungsprozess in seiner Identität und seinen Wertesystemen bedroht fuhlt.® 

Für beide Theorien finden sich Belege. Das durchschnittliche Einkommen 
der Wähler:innen der AfD und der Linken ist am niedrigsten, zudem ist die 
Mehrheit der AfD-Wähler:innen der Auffassung, ökonomisch benachteiligt zu 
sein. Hinzu kommen der geringer Anteil an Hochschulabsolvent:innen und ein 
überproportionaler Anteil an Wähler:innen aus den Neuen Bundesländern und 
ländlichen Gebieten. Diese Aspekte sind in ähnlicher Ausprägung bei den Wäh- 
ler:innen der Linken zu finden.s* 

Für die Cultural-Backlash-These spricht spezifisch, dass sich AfD-Wäh- 
ler:innen besonders um Zuwanderung, Kriminalität, das Ende des Friedens und 
ein Auseinanderbrechen der Gesellschaft sorgen. 

Die Darstellung der Wähler:innen stimmt mit der Erklärung der Motivfor- 
schung eines übersteigerten Machtmotivs überein. Studien haben gezeigt, dass 
typische Inhalte des Machtmotivs, wie die Angst vor Einflussverlust, Statusver- 
lustr oder dem Verlust gesellschaftlichen Ansehens, bei Personen mit einem nied- 
rigen oder bedrohten sozioökonomischen Status besonders ausgeprägt sind.‘ 

Während die AfD mit einem völkisch-autoritären Populismus und zuwan- 
derungskritischen Äußerungen auftritt und die Wählerschaft in prekären oder 
bedrohten sozioökonomischen Verhältnissen anspricht, setzt die Linke einen 
Akzent auf sozialpolitische Strategien und Arbeitnehmerperspektiven. Gemein- 
sam haben die Parteien einen Wähler:innenkreis mit niedrigem oder (gefühlt) 
bedrohtem sozioökonomischen Status. 

Hypothese 3 ist in Teilen bereits in Hypothese 2 enthalten; nachdem von 
einer eindeutigen Differenzierung der parteiinternen und politischen Kommu- 
nikation ausgegangen werden kann, ist davon auszugehen, dass im Gesamtda- 
tensatz nicht der reine Effekt der politischen Kommunikation messbar ist. Die 


a 


? Norris/Inglehart (2016); Rippl/Seipel (2018). 
3 Norris/Inglehart (2016). 

64 Brenke/Kritikos (2017). 

> McClelland (1999). 
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politische Kommunikation sollte fur die Wahleransprache und die Wahlerent- 
scheidung eine größere Rolle spielen als die parteiinterne Kommunikation. 

Hypothese 3b: Die Parteien AfD und Die Linke an den politischen Randern 
sollten ein signifikant starkeres Machtmotiv bei politischen Themen aufweisen 
als die übrigen Parteien. Das Bindungsmotiv sollte signifikant schwächer aus- 
geprägt sein. 


Daten und Modell 


Der Datensatz umfasst die Kommunikation der Parteien CDU, CSU, SPD, FDP, 
Bündnisgo / DIE GRÜNEN, DIE LINKE, AfD auf dem sozialen Medium Facebook 
über den Zeitraum 2013 bis 2017. 


Tab. 1: Deskriptive Statistik des Facebook-Datensatzes und des Trainingsdatensatzes über die einzel- 
nen Motive 

TOPICDUMMY NULL BINDUNG LEISTUNG MACHT TOTAL 

Intern 422 1736 3330 7540 13028 
3,24 13,33) (25,56) 57,88) 100,00 

Politisch 385 1978 3782 10748 16893 
2,28 11,71) (22,39) 63,62) 100,00 

Total 807 3714 m2 18288 29921 
2,70 12,41) (23,77) 61,12) 100,00 

Testdaten 7988 18974 38294 75275 140531 
5,16) 13,31) (26,63) 54,90) 100,00 


Der Facebook-Datensatz ist nach parteiinterner und politischer Kommunikation unterteilt. 


Tabelle 1 zeigt die Kodierung der Textmeldungen nach den drei Motiven sowie der 
Null (Leer-)Kodierung. Untergliedert ist die Darstellung nach dem Facebook-Da- 
tensatz und dem Trainingsdatensatz. Die Tabelle zeigt eine durchschnittlich hö- 
here Machtkodierung im Facebook-Datensatz als im Trainingsdatensatz und eine 
niedrigere Bindungs- und Leistungskodierung. Innerhalb des Facebook-Datensat- 
zes zeigt sich, dass die politische Kommunikation ein stärkeres Machtmotiv als 
die parteiinterne Kommunikation aufweist. Für die Interpretation ist zu beach- 
ten, dass die politische Dummy-Variable eine hohe Varianz an Themen aufweist. 

Neben der thematischen Kodierung und der Motivkodierung werden das 
Datum sowie die geteilten Inhalte (Status, Video, Foto, Veranstaltungen, Musik, 
Notiz, Link) als Kontrollvariablen hinzugezogen. Wir nutzen ein logarithmisches 
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Modell, um den Effekt der Parteizugehorigkeit in verschiedenen Spezifikationen 
der inkludierten Textmeldungen auf die Macht- beziehungsweise die Bindungs- 
kodierung zu untersuchen. 


k n 
PO: = 1) =F@Bo + X BiXi + >. 02) 

i=1 j=1 
X repräsentiert die Textnachrichten der Parteien i, Z, steht für die Kontrollvaria- 
blen des geteilten Contents j. Wir erstellen drei verschiedene Modelle. Zunachst 
wird nur die Parteizugehörigkeit geprüft, im nächsten Schritt werden die Kon- 
trollvariablen mit einbezogen und im dritten Modell wird der Datensatz von 
Ausreißern bereinigt. Ausreißer sind in diesem Zusammenhang wie folgt zu 
verstehen: Es werden einzelne einflussreiche Kovariaten-Muster entfernt. Auf 
diese Weise kann kontrolliert werden, ob Unterschiede durch einzelne Ereignis- 
se bedingt sind oder über den Datensatz hinweg auftreten. Die Ergebnisse wer- 

den als durchschnittliche marginale Effekte (AME) angegeben. 

Für die Darstellung des zeitlichen Verlaufs wird der „locally weighted scat- 
terplot smoother“ (LOWESS) genutzt.” Aufgrund der hohen Fallzahl wird ein 

niedriger Glättungsparameter von 0,3 angewandt. 


Auswertung 


Die Annahme, dass politische Akteur:innen das Motivmuster „starke Macht- 
und schwache Bindungskodierung“ aufweisen, bestätigt sich (Tabelle 2). Das 
Modell bestätigt, dass die Kommunikation über Soziale Medien den zu erwar- 
tenden Mustern aus herkömmlicher Kommunikation ähnelt, also Politiker:in- 
nen ein tendenziell höheres Machtmotiv aufweisen. 

Ebenfalls bestätigt sich die Annahme, dass die Parteien an den Rändern 
eine signifikant stärkere Machtkodierung aufweisen (Tabelle 3). Dabei bleibt 
sowohl der Unterschied zwischen der Linkspartei und den Parteien CDU, CSU, 
FDP, SPD sowie BÜNDNIS go / DIE GRÜNEN Grünen als auch der Unterschied 
zwischen der Linkspartei und der AfD in die entgegengesetzte Richtung hoch- 
signifikant. Die Ergebnisse sind gegenüber der Einführung der Kontrollvariab- 
len ebenso wie der Eliminierung der Ausreißer robust. Die signifikant erhöhten 
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Machtkodierungen und geringere Bindungskodierungen der AfD bestatigen, 
dass sich die rechtspopulistische Orientierung nicht nur in der thematischen 
Schwerpunktsetzung, sondern auch in der Motivkodierung zeigt. 


Tab. 2: Logistisches Modell des Macht- und Bindungsmotivs des Testdatensatzes und Facebook-Daten- 
satzes 
MODELL 1 MODELL 2 
MACHT- BINDUNGS- 
MOTIV MOTIV 

Testdatensatz o o 
Facebook-Daten 0,0756*** -0,0109*** 
Beobachtungen 170452 170452 


eee 


*p< 0,05, ** p < 0,01, ** p< 0,001 


Tab. 3: Logistisches Modell der Macht- und Bindungsmotive nach Parteien 


MODELL3 MODELL4 MODELL5 MODELL6 MODELL7 MODELL8 
MACHT- MACHT- MACHT- BILDUNGS- BILDUNGS- BILDUNGS- 
MOTIV MOTIV MOTIV MOTIV MOTIV MOTIV 


Krk Krk Krk 


AfD 0,0265** 0,0437*** 0,0562 -0,0157** -0,0274 -0,0224 
CDU -0,0611*** -0,0651*** -0,0659*** 0,0289*** 0,0302*** 0,0262*** 
CSU -0,0874***  -0,0766*** -0,0818*** 0,0553*** 0,0450*** 0,0357*** 
FDP -0,0358*** -0,0388*** -0,0225* ° 0,000405 o 
BÜNDNIS 90 /DIE GRÜNEN -0,0776*** — -0,0765*** -0,0847** 0,0483*** 0,0460*** 0,0413*** 
DIE LINKE o fe} fe) 0,00303 o 0,00289 
SPD -0,0417*** -0,0395*** -0,0355*** 0,0321*** 0,0284*** 0,0313*** 
Datum -0,0000537*** -0,0000565*** 0,0000370*** 0,0000384*** 
ontrollvariablen x x x x 
ovariaten-Muster x x 
Beobachtungen 29921 29921 28674 29921 29917 28004 


Kr 


*p< 0,05, ** p < 0,01, *“* p < 0,001 


Im nächsten Schritt werden die Ergebnisse der Motivanalyse mit der inhalts- 
analytischen Auswertung kombiniert. Es wird zwischen inhaltlich, politischen 
Fragestellungen und der parteiinternen Kommunikation unterschieden. 
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Tab. 4: Logistisches Modell der Machtkodierung nach Parteien — Unterschiede der innerparteilichen und 
politischen Kommunikation 


MODELL9 MODELL10 MODELL11 MODELL12 MODELL13 MODELL14 MODELL15 
MACHT- MACHT- MACHT- MACHT- MACHT- MACHT- MACHT- 
MOTIV MOTIV MOTIV MOTIV MOTIV MOTIV MOTIV 


AFD CDU CSU FDP GRÜNE LINKE SPD 
TopicDummy -0,0369* 0,00816 -0,121*** -0,0270* -0,0704*** -0,0286* -0,0461** 
Datum -0,00000815 -0,00000724 -0,000106*** -0,0000887*** -0,0000406* -0,0000571*** -0,0000774*** 
Kontroll- 
: x x x x x x x 
variabelen 
Beobachtungen 4908 3432 3423 5615 3246 5113 4174 


ee 


* p < 0,05, ** p < 0,01, ** p< 0,001 
Anmerkung: Interne Kommunikation ist mit 1 kodiert. 


Die Annahme, dass die Parteien intern eine weniger stark machtkodierte Kom- 
munikation praktizieren, konnte für nahezu alle Parteien bestätigt werden. Le- 
diglich die CDU weist weder eine signifikante Unterscheidung zwischen par- 
teiinterner und politischer Kommunikation noch den antizipierten negativen 
Zusammenhang auf. Für alle weiteren Parteien ist der erwartete negative Zu- 
sammenhang erkennbar und signifikant. 


Tab. 5: Logistisches Modell der Machtkodierung nach Parteien — innerparteiliche Kommunikation 
MODELL 16 MODELL 17 MODELL 18 
MACHT- MACHT- MACHT- 
MOTIV MOTIV MOTIV 
INTERN INTERN INTERN 
AfD 0,015 0,033 0,0427* 
CDU -0,0369* -0,0412** -0,0481** 
CSU -0,119*** -0,103*** -0,111*** 
FDP -0,0310* -0,0313* -0,00768 
BÜNDNIS 90 / DIE GRÜNEN -0,0989*** -0,0944*** -0,0992*** 
DIE LINKE o fe) (0) 
SPD -0,0552** -0,0459** -0,0512** 
Datum -0,0000513*** -0,0000495*** 
Kontrollvariablen x x 
Kovariaten-Muster x 
Beobachtungen 13335 13335 12879 


ee 


* p < 0,05, ** p < 0,01, *** p< 0,001 
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Tab. 6: Logistisches Modell der Machtkodierung nach Parteien — politische Kommunikation 


MODELL 19 MODELL 20 MODELL 21 
MACHT- MACHT- MACHT- 
MOTIV MOTIV MOTIV 
POLITISCH POLITISCH POLITISCH 
AfD 0,0245* 0,0388** 0,0513*** 
CDU -0,0785*** -0,0834*** -0,0665*** 
CSU -0,0291 -0,0225 -0,0173 
FDP -0,023 -0,0265 -0,009 
BÜNDNIS go / DIE GRÜNEN -0,0555*** -0,0588*** -0,0455** 
DIE LINKE o o o 
SPD -0,0366** -0,0401** -0,0269* 
Datum -0,0000596*** -0,0000605*** 
Kontrollvariablen x x 
ovariaten-Muster x 
Beobachtungen 16586 16584 16095 


*p< 0,05, ** p < 0,01, *“* p < 0,001 


Basierend auf den Theorien des Cultural Backlash und der Modernisierungs- 
verlierer wurde die Hypothese formuliert, dass die Parteien an den politischen 
Rändern mit einem erhöhten Wählerpotenzial aus prekären Verhältnissen oder 
peripheren Gebieten ebendieses Wählerpotenzial mit einer erhöhten Machtko- 
dierung und geringeren Bindungskodierung ansprechen. 

Die Hypothese, dass Parteien an den politischen Rändern ein stärkeres 
Motivmuster in der politischen Kommunikation aufweisen, kann für die AfD 
eindeutig bestätigt werden (Tabelle 6). Wir sehen eine signifikant stärkere 
Machtkodierung im Vergleich mit der nächstliegenden Partei DIE LINKE. Letz- 
tere weist den zweithöchsten Wert auf, unterscheidet sich dabei jedoch nicht 
signifikant von der FDP und der CSU. Die Bindungskodierung ist weniger robust 
gegenüber den Modellspezifikationen. Zwar ist die Bindungskodierung der AfD 
am schwächsten, sie unterscheidet sich aber nicht signifikant von dem Basis- 
wert der FDP. Signifikant ist hingegen der Unterschied im Vergleich mit den 
Grünen und der SPD sowie der Linken in der dritten Spezifikation. Insgesamt 
ist die Bindungskodierung des linken Parteienspektrums höher als des rechten 
Parteienspektrums. 

Auf die Hypothese bezogen kann es als bestätigt angesehen werden, dass 
die AfD mit einer ultrakonservativen bis völkisch-populistischen Ausrichtung 
eine erhöhte Machtkodierung aufweist (Tabelle 6). Dazu passend ist, dass die 
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Wahlerschaft, der psychologischen Literatur folgend, für diese Motivkodierung 
anfällig ist. 

In der parteiinternen Kommunikation (Tabelle 5) ist die Kodierung weniger 
eindeutig. Es zeigt sich allerdings, dass die Regierungsparteien und die Grünen 
mit einer stabilen Führungsspitze über den Zeitraum ein signifikant geringer 
kodiertes Machtmotiv aufweisen. Die AfD mit dem im Beobachtungszeitraum 
liegenden Flügelkampf weist die höchste Machtkodierung auf. Die Bindungsko- 
dierung ist den Modellspezifikationen gegenüber nicht robust. 

Über den betrachteten Untersuchungszeitraum konnte für die AfD nach- 
gewiesen werden, dass die Machtkodierung in Zeiten innerparteilicher Konflik- 
te ansteigt. Die Daten ermöglichen es, einzelne Events im Zeitverlauf nicht nur 
auf der Basis inhaltlicher Aspekte, sondern auch durch die Kodierung impliziter 
Motive nachzuweisen. In Abbildung 1 sind der Anstieg der Machtkodierung bis 
zum Parteitag am 4. Juli 2015 und der Anstieg hin zum Bundesparteitag am 22. 
April 2017 sowie ein deutlicher Rückgang der Machtkodierung hin zur Bundes- 
tagswahl 2017 zu erkennen. 


w 
x | 
Bundestagswahl 
Petry & Hoc! 201 
De auf dem AfD Budesparteitag in Essen 


am 4. Juli 2015 


P(Machtmotiv) 
65 
N 


Petry vs. Meuth 


eo Gauland, Weidel, = 
auf dem Bundespafteitag 
am 22. April 20) 
je} 
84 
> y x © © © S A A 
N N N N N N N N N 
C € | Dr er 
~ S ££ Ff D FF © p o 
© D © K © D © wv 
Anmerkung: Glattungsfaktor 0,3. 
Abb.1: LOWESS-Plot — Verlauf der Machtkodierung der innerparteilichen Kommunikation für Beob- 
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Tab. 7: Logistisches Modell Machtkodierung nach Parteien — Migration im Vergleich mit der übrigen 
politischen Kommunikation 


MODELL 22 MODELL 23 MODELL 24 MODELL 25 MODELL 26 MODELL 27 MODELL 28 
MACHT- MACHT- MACHT- MACHT- MACHT- MACHT- MACHT- 
MOTIV MOTIV MOTIV MOTIV MOTIV MOTIV MOTIV 


AFD CDU CSU FDP GRUNE LINKE SPD 
Migr- -0,0467** 0,179** 0,0590* -0,0979** -0,0241 0,0325 -0,0262 
Dummy i i : f , i : 
Datum 0,0000012 -0,00000395 -0,000103** -0,000105*** -0,0000721”* -0,0000493*  -0,0000951*** 
Kontroll- 

x x x x x x x 
variablen 
Beobach- 
66 86 

tungen 3747 14 1444 2141 17 3221 2775 


hee 


*p< 0,05, ** p < 0,01, ** p< 0,001 
Anmerkung: Datenbasis politische Kommunikation, Migration ist mit 1 kodiert. 


Neben der groben Unterscheidung zwischen parteiinterner und politischer 
Kommunikation wurde das relevanteste Thema über die Legislaturperiode für 
eine genauere Betrachtung herausgefiltert. Das Migrationsthema ist zudem als 
Hauptthema der AfD ab Mitte 2015 anzusehen. Im Vergleich mit den weiteren 
politischen Themen ist bei der CDU sowie der CSU eine signifikant stärkere 
Machtkodierung festzustellen. Die AfD hingegen weist eine geringere Macht- 
kodierung als in den weiteren politischen Themen auf. 

Die AfD ist jedoch die einzige Partei mit einem ansteigenden Machtmotiv 
im Bereich Migration im Zeitverlauf, wenngleich das Ergebnis nicht signifikant 
ist. Die weiteren Parteien weisen bis auf die CDU einen signifikant negativen 
Zusammenhang mit der Zeitvariablen auf. Dies deutet darauf hin, dass bei allen 
Parteien außer der AfD das Thema nach einem Hoch im Jahr 2015 im Rahmen 
der Bundestagswahl weniger Bedeutung hatte. 


Schlussfolgerungen 


Es kann zunächst festgestellt werden, dass die Machtkodierung politischer 
Kommunikation auf Sozialen Medien stärker ausgeprägt ist als im Vergleichs- 
datensatz. Unterstützt wird dieses Ergebnis von der Annahme, dass Politiker:in- 
nen grundsätzlich ein verstärktes Machtmotiv besitzen. 

Ein Motiv alleine wird den Wahlerfolg einer Partei nicht determinieren. 
Existierende Studien legen nahe, dass in den USA jene Präsidentschaftskandi- 
daten gewählt wurden, die dem Motivmuster der Bevölkerung am nächsten 
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kamen.® Erste Ergebnisse auf der Basis diesen Datensatzes liefern ähnliche Zu- 
sammenhänge wie in dieser Theorie. Aus dem Ergebnis ließe sich ableiten, dass 
implizite Inhalte bestimmte Wählergruppen besonders ansprechen. In Zukunft 
könnte die Untersuchung impliziter Motive daher einen Anhaltspunkt für die 
Prognose von Wahlergebnissen bieten. 

In den Untersuchungen zu Motivmustern der Sozialen Medien konnten 
die signifikanten Unterschiede zwischen den Parteien herausgearbeitet wer- 
den. Insbesondere weist die Polarisierung der Parteienlandschaft und die damit 
einhergehende signifikant stärkere Machtkodierung / geringere Bindungsko- 
dierung der AfD in Kombination mit einem wachsenden Wahlerfolg im Beob- 
achtungszeitraum darauf hin, dass sich die Wählerschaft dieser Motivkodierung 
zugehörig fühlt. 

Zudem kann ein signifikanter Unterschied zwischen der politischen und 
der parteiinternen Kommunikation festgestellt werden, der robust negativ si- 
gnifikant für alle Parteien außer der CDU ist. Insbesondere bei politischen Bei- 
trägen der CDU fällt ein hohes Maß an Darstellung politischer Erfolge auf. Dies 
würde erklären, weshalb ein umgekehrter Zusammenhang beobachtbar ist. 
Dieser wiederum könnte in der Position als „großer“ Partner in der großen Koa- 
lition und Partei der Bundeskanzlerin begründet liegen. 

Die tiefergehende Analyse einzelner politischer Themenfelder konnte 
am Beispiel der Migrationspolitik interessante Ergebnisse liefern. Es ist ein zu- 
nächst paradoxes Muster zu beobachten. Entgegen der intuitiven Vermutung, 
dass die AfD das stärkere Machtmotiv in ihrem Hauptthema besitzen sollte, ist 
das Machtmotiv signifikant geringer kodiert als im Fall der übrigen politischen 
Themen. Umgekehrtes ist bei der CDU und der CSU zu beobachten: Die Macht- 
kodierung ist robust über die Modellspezifikationen 17 bis 19 % höher als bei den 
weiteren politischen Themen. Eine mögliche Erklärung ist in der Konzeption der 
Motivmuster zu finden. Diese sind als Bedürfnisse zu verstehen. Wenn in einem 
Soll-Ist-Vergleich der Ist-Wert den Soll-Wert übersteigt, gibt es keine Diskrepanz 
mehr.® Im Fall der AfD gibt es durch die Erfolge in der Bestimmung des öffent- 
lichen Diskurses (von „Willkommenskultur“ hin zu Abschottung) und eine re- 
ale Reduzierung der Zuwanderung kaum nennenswerte Soll-Ist-Diskrepanzen. 
CDU und CSU hingegen waren in der Legislaturperiode (2013 bis 2017) getrieben 
von der AfD und der eigenen Basis. Das kann als eine Bedrohung der Stellungim 
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konservativen Spektrum und damit ein Auseinanderfallen von Anspruch und 
Wirklichkeit verstanden werden. Dies sollte zu einer heftigen emotionalen, auf 
stammesgeschichtlich alten Motiven beruhenden Reaktion führen, die einer ra- 
tionalen Kosten-Nutzen-Erwägung vorgelagert ist. 

Der extreme Anstieg des Machtmotivs beim Thema Migration bei CDU 
und CSU weist also auf ein emotionales Defizit hin: Es wurde wenig über das 
Thema gesprochen, dann jedoch emotional umso heftiger, mit einer hohen 
Machtkodierung, um sich im politischen Wettbewerb zu behaupten. Diese Kom- 
munikationsform kann unausgewogen wirken, das kann auf die emotionale 
und impulsive Natur von Motiven, insbesondere des Machtmotivs zurückge- 
führt werden. 

Der Beitrag zeigt, dass die Auswertung hinsichtlich psychologischer Mo- 
tive in Kombination mit inhaltsanalytischen Methoden zu interpretierbaren 
Ergebnissen führt. Da implizite Motive unwillkürlich sind, stellen die Ergebnis- 
se eine vielversprechende Alternative zu Sentiment Scores in der politischen 
Analyse dar. Die Kombination der Techniken erlaubt eine tiefergehende Ana- 
lyse informeller Kommunikation mit einem wenig gesteigerten Zeitaufwand. 
Gleichwohl bleiben die Ergebnisse immer sensibel gegenüber den Annahmen 
der zugrunde liegenden Algorithmen. 
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